Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.05.31;
Скачать: CL | DM;

Вниз

Распознавание текста   Найти похожие ветки 

 
cyber-pilot   (2009-04-01 14:29) [0]

Кто-нибудь пробовал запрограммировать распознавание текста? Если да, то какие результаты?

У меня задача немного проще. Мне нужно определить координаты строчек текста, т.е. координаты верхнего левого и правого нижнего угла прямоугольника, которым можно описать строчку. При этом считается, что картинка черно-белая, все строчки идут горизонтально.

Если отсканированный текст нормальный, т.е. высота шрифта везде одинаковая, нет разных колонок текста, нет искажений рисунка, нет рукописного текста, нет таблиц, то распознать, где находятся строчки текста легко по изменению концентрации черных точек. А вот что делать, если текст не "нормальный"?


 
tesseract ©   (2009-04-01 14:32) [1]


> А вот что делать, если текст не "нормальный"?


Нормализовать. Алгоритмы распознавания текста - это не для курсовая работа. Можешь скачать исходники tesseract и просмотреть, что там HP написала.


 
@!!ex ©   (2009-04-01 14:33) [2]

Кто нибудь пробовал.
Ваша задача довольно проста и сводится к грубой векторизации рисунка, когда строка текста представляется прямой линией. В эту сторону рекомендую копать. Inkscape умеет векторизовать рисунки и он OpenSource. Удачи.



Страницы: 1 вся ветка

Текущий архив: 2009.05.31;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.01 c
15-1238450406
Kerk
2009-03-31 02:00
2009.05.31
Свободное ПО в России


15-1238275805
Юрий
2009-03-29 00:30
2009.05.31
С днем рождения ! 29 марта 2009 воскресенье


6-1202409335
Del
2008-02-07 21:35
2009.05.31
Определение размера отправленых данных через TSocket


15-1238151873
Andy BitOff
2009-03-27 14:04
2009.05.31
Посоветуйте PropertyEditor


2-1239815188
Vov4ik
2009-04-15 21:06
2009.05.31
переход в конец текста в richedit