Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.05.31;
Скачать: CL | DM;

Вниз

Распознавание текста   Найти похожие ветки 

 
cyber-pilot   (2009-04-01 14:29) [0]

Кто-нибудь пробовал запрограммировать распознавание текста? Если да, то какие результаты?

У меня задача немного проще. Мне нужно определить координаты строчек текста, т.е. координаты верхнего левого и правого нижнего угла прямоугольника, которым можно описать строчку. При этом считается, что картинка черно-белая, все строчки идут горизонтально.

Если отсканированный текст нормальный, т.е. высота шрифта везде одинаковая, нет разных колонок текста, нет искажений рисунка, нет рукописного текста, нет таблиц, то распознать, где находятся строчки текста легко по изменению концентрации черных точек. А вот что делать, если текст не "нормальный"?


 
tesseract ©   (2009-04-01 14:32) [1]


> А вот что делать, если текст не "нормальный"?


Нормализовать. Алгоритмы распознавания текста - это не для курсовая работа. Можешь скачать исходники tesseract и просмотреть, что там HP написала.


 
@!!ex ©   (2009-04-01 14:33) [2]

Кто нибудь пробовал.
Ваша задача довольно проста и сводится к грубой векторизации рисунка, когда строка текста представляется прямой линией. В эту сторону рекомендую копать. Inkscape умеет векторизовать рисунки и он OpenSource. Удачи.



Страницы: 1 вся ветка

Текущий архив: 2009.05.31;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.015 c
3-1221766047
Девушка
2008-09-18 23:27
2009.05.31
Fib+ ClientDataSet + MasterDetail = Key Violation


10-1158130464
GrBob
2006-09-13 10:54
2009.05.31
ITypeInfo и имя интерфейса-предка.


2-1239815188
Vov4ik
2009-04-15 21:06
2009.05.31
переход в конец текста в richedit


15-1237980549
@!!ex
2009-03-25 14:29
2009.05.31
Помогите разобраться с SVN


2-1239697601
_Андрей
2009-04-14 12:26
2009.05.31
IdFTP & CreateThread