Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];

Вниз

анализ отсканированного изображения   Найти похожие ветки 

 
SuSanin   (2005-08-29 13:18) [0]

Есть отсканированный текст, его еще не распознали но уже очистили от шумов, сделали цвето коррекцию и т.п.
Необходимо найти на данном изображениии рисунок среди текста (он там есть, мы знаем!!, а комп нет). Нужен алгоритм поиска картинок на отсканированных изображениях.
принимаются любые толковые мысли. Про проги писать не надо, если нет их исходников.


 
Digitman ©   (2005-08-29 13:49) [1]


> толковые мысли


мысль не изобретать очередной веросипед, а воспользоваться ГОТОВЫМ интерфейсом ГОТОВОГО объекта автоматизации - программы FineReader, будет "толковой" ?


 
PAVIA ©   (2005-08-29 13:58) [2]

Выделяем блоки. Блок -множество пикселей ограниченных замкнутым контуром.Пиксели внутри блока находяться на близком растоянии друг от друга, 1-5 пикселя.
Пробуем распознать текст в блоке, если удается то текст, иначе картинка.


 
Наиль ©   (2005-08-29 14:13) [3]


> Пробуем распознать текст в блоке

:-)
Как правило рисунок это прямоугольник большого размера.
В общем случае - контур большого размера.
Для определения контура точки окружёные не белыми точками делаешь белыми. Останутся только границы фигур. А дальше

> Пиксели
> находяться на близком растоянии друг от друга,
> 1-5 пикселя.

вот тебе и контур.


 
Чапаев ©   (2005-08-29 14:46) [4]

Типичная задача сегментации изображения. Ищи большой (значительно больший размера буквы) участок нефонового цвета.


 
Jeer ©   (2005-08-29 15:35) [5]

А лучше все наоборот.
Текст распознать проще - некая систематическая структура.
После нахождения символов текста отсекаем их.
Остается изображение.

Если об изображении заранее ничего не известно, то это единственный устойчивый алгоритм.


 
Чапаев ©   (2005-08-29 15:56) [6]

> После нахождения символов текста отсекаем их.
Не совсем так. На практике удобней отсекать СТРОКИ текста, а не символы.


 
Jeer ©   (2005-08-30 14:57) [7]

Чапаев ©   (29.08.05 15:56) [6]

Ну и что такое строка текста ?
Прямоугольная область внутри которой расположены символы ?
Тогда неверно, т.к. будут отсечено все что непокрыто символами.

Итого - отсекать символы с использованием совета [1]


 
SuSanin   (2005-08-31 12:09) [8]

Первое, спасибо всем за мысли.
2. Пишу программу предобработки (очистки, фильтрации,...) растрового изображения до распозновния.
3. Распознование НЕ пишу.
4. Рис. могут быть малого размера и лежать в строке с текстом. Типа нажмите на эту ... кнопку.
5. И еще, как разбили на блоки ??
6. Есть идея наити среднее значение по строкам. сложить-> поделить на кол-во пикс. в строке-> построить график -> типа синусойда, где откланения там картинка. Но это по координаты по высоте, а как найти по ширине?



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.042 c
15-1137584595
Харько (настоящий)
2006-01-18 14:43
2006.02.12
В какого оператора самые низике цены на GPRS?


15-1137615030
DillerXX
2006-01-18 23:10
2006.02.12
Подскажите названия песен...


11-1118647887
konst
2005-06-13 11:31
2006.02.12
Работа со статусной строкой


1-1136819121
utter
2006-01-09 18:05
2006.02.12
Удаление файлов по маске


2-1138274042
Ell
2006-01-26 14:14
2006.02.12
Ошибка при попытке записи на read-only диск





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский