Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.08.27;
Скачать: CL | DM;

Вниз

Bitmap + OCR   Найти похожие ветки 

 
SIV5000   (2010-05-17 14:01) [0]

Народ привет. Помогите пожалуйста со следующим.
Имееться просканированая книжка в .bmp. На страницах встречаються буквы разных размеров (основной текст и первая буква абзаца) также есть небольшие рисунки. Как можно вычислить границы первых букв, не спираясь на то что размер всех сканов одинаковый. И допустим, слева на право до начала первой буквы разные растояния на всех страницах.
Как програма должна обработать страницу и понять где что находиться? Если есть примеры, скиньте пожалуйста!!!


 
И. Павел ©   (2010-05-17 14:38) [1]

Лучше всего поискать готовые решения с API для этого дела.
Иначе будет очень неточно.
Вот мое ИМХО:
Если у большой буквы линии толще, то при чтении ее пикселей по вертикали и горизонтали черный и белый цвета будут меняться медленнее, чем у обычной. Можно попробовать наложить на страницу "решетку", пройтись по ней, и искать места скопления толстых линий. Но произвольный рисунок, содержащий те же цвета, что и буквы, ИМХО, без распознавания, можно отличить только нахождением границ (он же прямоугольный, т.е. все черные линии прерываются одновременно).


 
И. Павел ©   (2010-05-17 14:41) [2]

http://www.google.ru/search?hl=ru&newwindow=1&q=OCR+API+Delphi&aq=f&aqi=&aql=&oq=&gs_rfai=



Страницы: 1 вся ветка

Текущий архив: 2010.08.27;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.091 c
6-1219394993
+koha
2008-08-22 12:49
2010.08.27
Многопоточный сервер на чистом API


15-1267032774
Кто б сомневался
2010-02-24 20:32
2010.08.27
Delphi roadmap


2-1272172207
@!!ex
2010-04-25 09:10
2010.08.27
Как програмно удалить IE Cookes и сохраненные пароли?


11-1220147198
Jon
2008-08-31 05:46
2010.08.27
Audio Input Monitor


6-1224709751
serko
2008-10-23 01:09
2010.08.27
Telnet через Delphi...