Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];

Вниз

анализ отсканированного изображения   Найти похожие ветки 

 
SuSanin   (2005-08-29 13:18) [0]

Есть отсканированный текст, его еще не распознали но уже очистили от шумов, сделали цвето коррекцию и т.п.
Необходимо найти на данном изображениии рисунок среди текста (он там есть, мы знаем!!, а комп нет). Нужен алгоритм поиска картинок на отсканированных изображениях.
принимаются любые толковые мысли. Про проги писать не надо, если нет их исходников.


 
Digitman ©   (2005-08-29 13:49) [1]


> толковые мысли


мысль не изобретать очередной веросипед, а воспользоваться ГОТОВЫМ интерфейсом ГОТОВОГО объекта автоматизации - программы FineReader, будет "толковой" ?


 
PAVIA ©   (2005-08-29 13:58) [2]

Выделяем блоки. Блок -множество пикселей ограниченных замкнутым контуром.Пиксели внутри блока находяться на близком растоянии друг от друга, 1-5 пикселя.
Пробуем распознать текст в блоке, если удается то текст, иначе картинка.


 
Наиль ©   (2005-08-29 14:13) [3]


> Пробуем распознать текст в блоке

:-)
Как правило рисунок это прямоугольник большого размера.
В общем случае - контур большого размера.
Для определения контура точки окружёные не белыми точками делаешь белыми. Останутся только границы фигур. А дальше

> Пиксели
> находяться на близком растоянии друг от друга,
> 1-5 пикселя.

вот тебе и контур.


 
Чапаев ©   (2005-08-29 14:46) [4]

Типичная задача сегментации изображения. Ищи большой (значительно больший размера буквы) участок нефонового цвета.


 
Jeer ©   (2005-08-29 15:35) [5]

А лучше все наоборот.
Текст распознать проще - некая систематическая структура.
После нахождения символов текста отсекаем их.
Остается изображение.

Если об изображении заранее ничего не известно, то это единственный устойчивый алгоритм.


 
Чапаев ©   (2005-08-29 15:56) [6]

> После нахождения символов текста отсекаем их.
Не совсем так. На практике удобней отсекать СТРОКИ текста, а не символы.


 
Jeer ©   (2005-08-30 14:57) [7]

Чапаев ©   (29.08.05 15:56) [6]

Ну и что такое строка текста ?
Прямоугольная область внутри которой расположены символы ?
Тогда неверно, т.к. будут отсечено все что непокрыто символами.

Итого - отсекать символы с использованием совета [1]


 
SuSanin   (2005-08-31 12:09) [8]

Первое, спасибо всем за мысли.
2. Пишу программу предобработки (очистки, фильтрации,...) растрового изображения до распозновния.
3. Распознование НЕ пишу.
4. Рис. могут быть малого размера и лежать в строке с текстом. Типа нажмите на эту ... кнопку.
5. И еще, как разбили на блоки ??
6. Есть идея наити среднее значение по строкам. сложить-> поделить на кол-во пикс. в строке-> построить график -> типа синусойда, где откланения там картинка. Но это по координаты по высоте, а как найти по ширине?



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.47 MB
Время: 0.036 c
15-1137518626
Knight
2006-01-17 20:23
2006.02.12
Это называется "Чем дальше в лес, тем больше пофих"?


15-1136730093
Kerk
2006-01-08 17:21
2006.02.12
Видел только что НЛО.


15-1137657018
Kostik
2006-01-19 10:50
2006.02.12
Delphi 8


5-1124896760
ArtemESC
2005-08-24 19:19
2006.02.12
Текстовой компонент с графикой...


2-1138104329
K_Lock
2006-01-24 15:05
2006.02.12
Таблица и индексы





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский