Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.08.27;
Скачать: CL | DM;

Вниз

Bitmap + OCR   Найти похожие ветки 

 
SIV5000   (2010-05-17 14:01) [0]

Народ привет. Помогите пожалуйста со следующим.
Имееться просканированая книжка в .bmp. На страницах встречаються буквы разных размеров (основной текст и первая буква абзаца) также есть небольшие рисунки. Как можно вычислить границы первых букв, не спираясь на то что размер всех сканов одинаковый. И допустим, слева на право до начала первой буквы разные растояния на всех страницах.
Как програма должна обработать страницу и понять где что находиться? Если есть примеры, скиньте пожалуйста!!!


 
И. Павел ©   (2010-05-17 14:38) [1]

Лучше всего поискать готовые решения с API для этого дела.
Иначе будет очень неточно.
Вот мое ИМХО:
Если у большой буквы линии толще, то при чтении ее пикселей по вертикали и горизонтали черный и белый цвета будут меняться медленнее, чем у обычной. Можно попробовать наложить на страницу "решетку", пройтись по ней, и искать места скопления толстых линий. Но произвольный рисунок, содержащий те же цвета, что и буквы, ИМХО, без распознавания, можно отличить только нахождением границ (он же прямоугольный, т.е. все черные линии прерываются одновременно).


 
И. Павел ©   (2010-05-17 14:41) [2]

http://www.google.ru/search?hl=ru&newwindow=1&q=OCR+API+Delphi&aq=f&aqi=&aql=&oq=&gs_rfai=



Страницы: 1 вся ветка

Текущий архив: 2010.08.27;
Скачать: CL | DM;

Наверх




Память: 0.44 MB
Время: 0.062 c
15-1267134756
Кто б сомневался
2010-02-26 00:52
2010.08.27
Реклама Microsoft


2-1273211356
slay64
2010-05-07 09:49
2010.08.27
Ошибка в запросе


2-1268239219
Eugen1501
2010-03-10 19:40
2010.08.27
TIdMultipartFormDataStream;


2-1275314584
worldmen
2010-05-31 18:03
2010.08.27
группировать по месяцу


2-1272622374
slay64
2010-04-30 14:12
2010.08.27
Хранимая процедура





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский