Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.02.12;
Скачать: CL | DM;

Вниз

анализ отсканированного изображения   Найти похожие ветки 

 
SuSanin   (2005-08-29 13:18) [0]

Есть отсканированный текст, его еще не распознали но уже очистили от шумов, сделали цвето коррекцию и т.п.
Необходимо найти на данном изображениии рисунок среди текста (он там есть, мы знаем!!, а комп нет). Нужен алгоритм поиска картинок на отсканированных изображениях.
принимаются любые толковые мысли. Про проги писать не надо, если нет их исходников.


 
Digitman ©   (2005-08-29 13:49) [1]


> толковые мысли


мысль не изобретать очередной веросипед, а воспользоваться ГОТОВЫМ интерфейсом ГОТОВОГО объекта автоматизации - программы FineReader, будет "толковой" ?


 
PAVIA ©   (2005-08-29 13:58) [2]

Выделяем блоки. Блок -множество пикселей ограниченных замкнутым контуром.Пиксели внутри блока находяться на близком растоянии друг от друга, 1-5 пикселя.
Пробуем распознать текст в блоке, если удается то текст, иначе картинка.


 
Наиль ©   (2005-08-29 14:13) [3]


> Пробуем распознать текст в блоке

:-)
Как правило рисунок это прямоугольник большого размера.
В общем случае - контур большого размера.
Для определения контура точки окружёные не белыми точками делаешь белыми. Останутся только границы фигур. А дальше

> Пиксели
> находяться на близком растоянии друг от друга,
> 1-5 пикселя.

вот тебе и контур.


 
Чапаев ©   (2005-08-29 14:46) [4]

Типичная задача сегментации изображения. Ищи большой (значительно больший размера буквы) участок нефонового цвета.


 
Jeer ©   (2005-08-29 15:35) [5]

А лучше все наоборот.
Текст распознать проще - некая систематическая структура.
После нахождения символов текста отсекаем их.
Остается изображение.

Если об изображении заранее ничего не известно, то это единственный устойчивый алгоритм.


 
Чапаев ©   (2005-08-29 15:56) [6]

> После нахождения символов текста отсекаем их.
Не совсем так. На практике удобней отсекать СТРОКИ текста, а не символы.


 
Jeer ©   (2005-08-30 14:57) [7]

Чапаев ©   (29.08.05 15:56) [6]

Ну и что такое строка текста ?
Прямоугольная область внутри которой расположены символы ?
Тогда неверно, т.к. будут отсечено все что непокрыто символами.

Итого - отсекать символы с использованием совета [1]


 
SuSanin   (2005-08-31 12:09) [8]

Первое, спасибо всем за мысли.
2. Пишу программу предобработки (очистки, фильтрации,...) растрового изображения до распозновния.
3. Распознование НЕ пишу.
4. Рис. могут быть малого размера и лежать в строке с текстом. Типа нажмите на эту ... кнопку.
5. И еще, как разбили на блоки ??
6. Есть идея наити среднее значение по строкам. сложить-> поделить на кол-во пикс. в строке-> построить график -> типа синусойда, где откланения там картинка. Но это по координаты по высоте, а как найти по ширине?



Страницы: 1 вся ветка

Текущий архив: 2006.02.12;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.069 c
15-1137909887
begin...end
2006-01-22 09:04
2006.02.12
С Днём рождения! 22 января


2-1138090132
Vitekkk
2006-01-24 11:08
2006.02.12
Определить систему


4-1133172043
kblc
2005-11-28 13:00
2006.02.12
Thread u Com


4-1133045302
Volf_555
2005-11-27 01:48
2006.02.12
Как завершить процесс, зная откуда он запущен?


3-1134631703
vajo
2005-12-15 10:28
2006.02.12
Почему-то неправильно получается значение RecordCount