Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.05.31;
Скачать: CL | DM;

Вниз

Распознавание текста   Найти похожие ветки 

 
cyber-pilot   (2009-04-01 14:29) [0]

Кто-нибудь пробовал запрограммировать распознавание текста? Если да, то какие результаты?

У меня задача немного проще. Мне нужно определить координаты строчек текста, т.е. координаты верхнего левого и правого нижнего угла прямоугольника, которым можно описать строчку. При этом считается, что картинка черно-белая, все строчки идут горизонтально.

Если отсканированный текст нормальный, т.е. высота шрифта везде одинаковая, нет разных колонок текста, нет искажений рисунка, нет рукописного текста, нет таблиц, то распознать, где находятся строчки текста легко по изменению концентрации черных точек. А вот что делать, если текст не "нормальный"?


 
tesseract ©   (2009-04-01 14:32) [1]


> А вот что делать, если текст не "нормальный"?


Нормализовать. Алгоритмы распознавания текста - это не для курсовая работа. Можешь скачать исходники tesseract и просмотреть, что там HP написала.


 
@!!ex ©   (2009-04-01 14:33) [2]

Кто нибудь пробовал.
Ваша задача довольно проста и сводится к грубой векторизации рисунка, когда строка текста представляется прямой линией. В эту сторону рекомендую копать. Inkscape умеет векторизовать рисунки и он OpenSource. Удачи.



Страницы: 1 вся ветка

Текущий архив: 2009.05.31;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.012 c
2-1239867280
zz14
2009-04-16 11:34
2009.05.31
позиция символа в TEdit


2-1239283727
Franzy
2009-04-09 17:28
2009.05.31
null-terminated strings


15-1237904092
MsGuns
2009-03-24 17:14
2009.05.31
Вопрос п 1с (просьба не удалять)


15-1238486183
desc
2009-03-31 11:56
2009.05.31
Что может быть ? Не могу откомпелировать компонент...


9-1179831261
Jkot
2007-05-22 14:54
2009.05.31
Луч и треугольник.