Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.08.27;
Скачать: CL | DM;

Вниз

Bitmap + OCR   Найти похожие ветки 

 
SIV5000   (2010-05-17 14:01) [0]

Народ привет. Помогите пожалуйста со следующим.
Имееться просканированая книжка в .bmp. На страницах встречаються буквы разных размеров (основной текст и первая буква абзаца) также есть небольшие рисунки. Как можно вычислить границы первых букв, не спираясь на то что размер всех сканов одинаковый. И допустим, слева на право до начала первой буквы разные растояния на всех страницах.
Как програма должна обработать страницу и понять где что находиться? Если есть примеры, скиньте пожалуйста!!!


 
И. Павел ©   (2010-05-17 14:38) [1]

Лучше всего поискать готовые решения с API для этого дела.
Иначе будет очень неточно.
Вот мое ИМХО:
Если у большой буквы линии толще, то при чтении ее пикселей по вертикали и горизонтали черный и белый цвета будут меняться медленнее, чем у обычной. Можно попробовать наложить на страницу "решетку", пройтись по ней, и искать места скопления толстых линий. Но произвольный рисунок, содержащий те же цвета, что и буквы, ИМХО, без распознавания, можно отличить только нахождением границ (он же прямоугольный, т.е. все черные линии прерываются одновременно).


 
И. Павел ©   (2010-05-17 14:41) [2]

http://www.google.ru/search?hl=ru&newwindow=1&q=OCR+API+Delphi&aq=f&aqi=&aql=&oq=&gs_rfai=



Страницы: 1 вся ветка

Текущий архив: 2010.08.27;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.059 c
15-1268404840
Илья_
2010-03-12 17:40
2010.08.27
Ошибка при отладке программы с помощью функции Trace into


6-1223267358
JohnKorsh
2008-10-06 08:29
2010.08.27
Индикация наличия пакета.


15-1273264199
Юрий
2010-05-08 00:29
2010.08.27
С днем рождения ! 8 мая 2010 суббота


2-1265626291
Petr
2010-02-08 13:51
2010.08.27
Работа с Вложенными циклами


15-1270633433
И. Павел
2010-04-07 13:43
2010.08.27
Порекомендуйте компонент для шифрования