Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];

Вниз

анализ отсканированного изображения   Найти похожие ветки 

 
SuSanin   (2005-08-29 13:18) [0]

Есть отсканированный текст, его еще не распознали но уже очистили от шумов, сделали цвето коррекцию и т.п.
Необходимо найти на данном изображениии рисунок среди текста (он там есть, мы знаем!!, а комп нет). Нужен алгоритм поиска картинок на отсканированных изображениях.
принимаются любые толковые мысли. Про проги писать не надо, если нет их исходников.


 
Digitman ©   (2005-08-29 13:49) [1]


> толковые мысли


мысль не изобретать очередной веросипед, а воспользоваться ГОТОВЫМ интерфейсом ГОТОВОГО объекта автоматизации - программы FineReader, будет "толковой" ?


 
PAVIA ©   (2005-08-29 13:58) [2]

Выделяем блоки. Блок -множество пикселей ограниченных замкнутым контуром.Пиксели внутри блока находяться на близком растоянии друг от друга, 1-5 пикселя.
Пробуем распознать текст в блоке, если удается то текст, иначе картинка.


 
Наиль ©   (2005-08-29 14:13) [3]


> Пробуем распознать текст в блоке

:-)
Как правило рисунок это прямоугольник большого размера.
В общем случае - контур большого размера.
Для определения контура точки окружёные не белыми точками делаешь белыми. Останутся только границы фигур. А дальше

> Пиксели
> находяться на близком растоянии друг от друга,
> 1-5 пикселя.

вот тебе и контур.


 
Чапаев ©   (2005-08-29 14:46) [4]

Типичная задача сегментации изображения. Ищи большой (значительно больший размера буквы) участок нефонового цвета.


 
Jeer ©   (2005-08-29 15:35) [5]

А лучше все наоборот.
Текст распознать проще - некая систематическая структура.
После нахождения символов текста отсекаем их.
Остается изображение.

Если об изображении заранее ничего не известно, то это единственный устойчивый алгоритм.


 
Чапаев ©   (2005-08-29 15:56) [6]

> После нахождения символов текста отсекаем их.
Не совсем так. На практике удобней отсекать СТРОКИ текста, а не символы.


 
Jeer ©   (2005-08-30 14:57) [7]

Чапаев ©   (29.08.05 15:56) [6]

Ну и что такое строка текста ?
Прямоугольная область внутри которой расположены символы ?
Тогда неверно, т.к. будут отсечено все что непокрыто символами.

Итого - отсекать символы с использованием совета [1]


 
SuSanin   (2005-08-31 12:09) [8]

Первое, спасибо всем за мысли.
2. Пишу программу предобработки (очистки, фильтрации,...) растрового изображения до распозновния.
3. Распознование НЕ пишу.
4. Рис. могут быть малого размера и лежать в строке с текстом. Типа нажмите на эту ... кнопку.
5. И еще, как разбили на блоки ??
6. Есть идея наити среднее значение по строкам. сложить-> поделить на кол-во пикс. в строке-> построить график -> типа синусойда, где откланения там картинка. Но это по координаты по высоте, а как найти по ширине?



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2006.02.12;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.038 c
1-1136980916
Gear
2006-01-11 15:01
2006.02.12
Как можно установить Merge Module (*.MSM) с помощью Delphi ?


2-1137971775
Dormidont
2006-01-23 02:16
2006.02.12
Срочно нужна помощь


2-1138253763
Radix
2006-01-26 08:36
2006.02.12
Сделать выборку пропущенных номеров из БД на SQL


10-1112692034
Crazzy Jazzy
2005-04-05 13:07
2006.02.12
Mathcad + Delphi


15-1137880618
Arkano
2006-01-22 00:56
2006.02.12
Защита программы от взлома





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский