Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.08.27;
Скачать: CL | DM;

Вниз

Bitmap + OCR   Найти похожие ветки 

 
SIV5000   (2010-05-17 14:01) [0]

Народ привет. Помогите пожалуйста со следующим.
Имееться просканированая книжка в .bmp. На страницах встречаються буквы разных размеров (основной текст и первая буква абзаца) также есть небольшие рисунки. Как можно вычислить границы первых букв, не спираясь на то что размер всех сканов одинаковый. И допустим, слева на право до начала первой буквы разные растояния на всех страницах.
Как програма должна обработать страницу и понять где что находиться? Если есть примеры, скиньте пожалуйста!!!


 
И. Павел ©   (2010-05-17 14:38) [1]

Лучше всего поискать готовые решения с API для этого дела.
Иначе будет очень неточно.
Вот мое ИМХО:
Если у большой буквы линии толще, то при чтении ее пикселей по вертикали и горизонтали черный и белый цвета будут меняться медленнее, чем у обычной. Можно попробовать наложить на страницу "решетку", пройтись по ней, и искать места скопления толстых линий. Но произвольный рисунок, содержащий те же цвета, что и буквы, ИМХО, без распознавания, можно отличить только нахождением границ (он же прямоугольный, т.е. все черные линии прерываются одновременно).


 
И. Павел ©   (2010-05-17 14:41) [2]

http://www.google.ru/search?hl=ru&newwindow=1&q=OCR+API+Delphi&aq=f&aqi=&aql=&oq=&gs_rfai=



Страницы: 1 вся ветка

Текущий архив: 2010.08.27;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.19 c
15-1265871748
KSergey
2010-02-11 10:02
2010.08.27
PHP, веб, пароли, файлы


2-1268142361
Irisss
2010-03-09 16:46
2010.08.27
Как сервер fireBird отключить


15-1267798757
Jeer
2010-03-05 17:19
2010.08.27
Любимым и дорогим Женщинам.


2-1272608622
abun
2010-04-30 10:23
2010.08.27
Как из gif достать кадры без библиотеки RX


2-1270329778
Б
2010-04-04 01:22
2010.08.27
String -> WideChar