Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.05.31;
Скачать: CL | DM;

Вниз

Распознавание текста   Найти похожие ветки 

 
cyber-pilot   (2009-04-01 14:29) [0]

Кто-нибудь пробовал запрограммировать распознавание текста? Если да, то какие результаты?

У меня задача немного проще. Мне нужно определить координаты строчек текста, т.е. координаты верхнего левого и правого нижнего угла прямоугольника, которым можно описать строчку. При этом считается, что картинка черно-белая, все строчки идут горизонтально.

Если отсканированный текст нормальный, т.е. высота шрифта везде одинаковая, нет разных колонок текста, нет искажений рисунка, нет рукописного текста, нет таблиц, то распознать, где находятся строчки текста легко по изменению концентрации черных точек. А вот что делать, если текст не "нормальный"?


 
tesseract ©   (2009-04-01 14:32) [1]


> А вот что делать, если текст не "нормальный"?


Нормализовать. Алгоритмы распознавания текста - это не для курсовая работа. Можешь скачать исходники tesseract и просмотреть, что там HP написала.


 
@!!ex ©   (2009-04-01 14:33) [2]

Кто нибудь пробовал.
Ваша задача довольно проста и сводится к грубой векторизации рисунка, когда строка текста представляется прямой линией. В эту сторону рекомендую копать. Inkscape умеет векторизовать рисунки и он OpenSource. Удачи.



Страницы: 1 вся ветка

Текущий архив: 2009.05.31;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.007 c
15-1238188551
Petr V. Abramov
2009-03-28 00:15
2009.05.31
Африк Симон Все пройдет, Мария


15-1237980549
@!!ex
2009-03-25 14:29
2009.05.31
Помогите разобраться с SVN


2-1240229032
Zalum
2009-04-20 16:03
2009.05.31
Процедура из другого приложения


2-1240003513
Gringoire
2009-04-18 01:25
2009.05.31
SQL запрос


3-1222062150
Юрий Катунов
2008-09-22 09:42
2009.05.31
Сортировка в DBGrid