Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.02.12;
Скачать: CL | DM;

Вниз

анализ отсканированного изображения   Найти похожие ветки 

 
SuSanin   (2005-08-29 13:18) [0]

Есть отсканированный текст, его еще не распознали но уже очистили от шумов, сделали цвето коррекцию и т.п.
Необходимо найти на данном изображениии рисунок среди текста (он там есть, мы знаем!!, а комп нет). Нужен алгоритм поиска картинок на отсканированных изображениях.
принимаются любые толковые мысли. Про проги писать не надо, если нет их исходников.


 
Digitman ©   (2005-08-29 13:49) [1]


> толковые мысли


мысль не изобретать очередной веросипед, а воспользоваться ГОТОВЫМ интерфейсом ГОТОВОГО объекта автоматизации - программы FineReader, будет "толковой" ?


 
PAVIA ©   (2005-08-29 13:58) [2]

Выделяем блоки. Блок -множество пикселей ограниченных замкнутым контуром.Пиксели внутри блока находяться на близком растоянии друг от друга, 1-5 пикселя.
Пробуем распознать текст в блоке, если удается то текст, иначе картинка.


 
Наиль ©   (2005-08-29 14:13) [3]


> Пробуем распознать текст в блоке

:-)
Как правило рисунок это прямоугольник большого размера.
В общем случае - контур большого размера.
Для определения контура точки окружёные не белыми точками делаешь белыми. Останутся только границы фигур. А дальше

> Пиксели
> находяться на близком растоянии друг от друга,
> 1-5 пикселя.

вот тебе и контур.


 
Чапаев ©   (2005-08-29 14:46) [4]

Типичная задача сегментации изображения. Ищи большой (значительно больший размера буквы) участок нефонового цвета.


 
Jeer ©   (2005-08-29 15:35) [5]

А лучше все наоборот.
Текст распознать проще - некая систематическая структура.
После нахождения символов текста отсекаем их.
Остается изображение.

Если об изображении заранее ничего не известно, то это единственный устойчивый алгоритм.


 
Чапаев ©   (2005-08-29 15:56) [6]

> После нахождения символов текста отсекаем их.
Не совсем так. На практике удобней отсекать СТРОКИ текста, а не символы.


 
Jeer ©   (2005-08-30 14:57) [7]

Чапаев ©   (29.08.05 15:56) [6]

Ну и что такое строка текста ?
Прямоугольная область внутри которой расположены символы ?
Тогда неверно, т.к. будут отсечено все что непокрыто символами.

Итого - отсекать символы с использованием совета [1]


 
SuSanin   (2005-08-31 12:09) [8]

Первое, спасибо всем за мысли.
2. Пишу программу предобработки (очистки, фильтрации,...) растрового изображения до распозновния.
3. Распознование НЕ пишу.
4. Рис. могут быть малого размера и лежать в строке с текстом. Типа нажмите на эту ... кнопку.
5. И еще, как разбили на блоки ??
6. Есть идея наити среднее значение по строкам. сложить-> поделить на кол-во пикс. в строке-> построить график -> типа синусойда, где откланения там картинка. Но это по координаты по высоте, а как найти по ширине?



Страницы: 1 вся ветка

Текущий архив: 2006.02.12;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.044 c
15-1137576334
begin...end
2006-01-18 12:25
2006.02.12
Как отключить XP-стиль у окошка входа в Windows XP?


11-1118179095
Thaddy
2005-06-08 01:18
2006.02.12
Interested in KOL+ Wine?


8-1125637112
Riddick
2005-09-02 08:58
2006.02.12
Canvas


15-1137861299
lookin
2006-01-21 19:34
2006.02.12
Задача из IQ-теста


1-1136974706
Barsky
2006-01-11 13:18
2006.02.12
Скрол (мышыный) в гриде