Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];

Вниз

Bitmap + OCR   Найти похожие ветки 

 
SIV5000   (2010-05-17 14:01) [0]

Народ привет. Помогите пожалуйста со следующим.
Имееться просканированая книжка в .bmp. На страницах встречаються буквы разных размеров (основной текст и первая буква абзаца) также есть небольшие рисунки. Как можно вычислить границы первых букв, не спираясь на то что размер всех сканов одинаковый. И допустим, слева на право до начала первой буквы разные растояния на всех страницах.
Как програма должна обработать страницу и понять где что находиться? Если есть примеры, скиньте пожалуйста!!!


 
И. Павел ©   (2010-05-17 14:38) [1]

Лучше всего поискать готовые решения с API для этого дела.
Иначе будет очень неточно.
Вот мое ИМХО:
Если у большой буквы линии толще, то при чтении ее пикселей по вертикали и горизонтали черный и белый цвета будут меняться медленнее, чем у обычной. Можно попробовать наложить на страницу "решетку", пройтись по ней, и искать места скопления толстых линий. Но произвольный рисунок, содержащий те же цвета, что и буквы, ИМХО, без распознавания, можно отличить только нахождением границ (он же прямоугольный, т.е. все черные линии прерываются одновременно).


 
И. Павел ©   (2010-05-17 14:41) [2]

http://www.google.ru/search?hl=ru&newwindow=1&q=OCR+API+Delphi&aq=f&aqi=&aql=&oq=&gs_rfai=



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.44 MB
Время: 0.085 c
6-1217494301
dime_veyron
2008-07-31 12:51
2010.08.27
Версия Windows через локальную сеть


15-1272975151
NailMan
2010-05-04 16:12
2010.08.27
К летнему сезону киберматрицы готов!


15-1269176860
Правильный$Вася
2010-03-21 16:07
2010.08.27
загрузочный ли образ


2-1268820037
oleg1963lora
2010-03-17 13:00
2010.08.27
TimeToStr. Изменение FormatSettings


15-1270305381
Игорь Шевченко
2010-04-03 18:36
2010.08.27
Microsoft заботится о нас. Иногда даже чересчур





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский