Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2009.05.31;
Скачать: [xml.tar.bz2];

Вниз

Распознавание текста   Найти похожие ветки 

 
cyber-pilot   (2009-04-01 14:29) [0]

Кто-нибудь пробовал запрограммировать распознавание текста? Если да, то какие результаты?

У меня задача немного проще. Мне нужно определить координаты строчек текста, т.е. координаты верхнего левого и правого нижнего угла прямоугольника, которым можно описать строчку. При этом считается, что картинка черно-белая, все строчки идут горизонтально.

Если отсканированный текст нормальный, т.е. высота шрифта везде одинаковая, нет разных колонок текста, нет искажений рисунка, нет рукописного текста, нет таблиц, то распознать, где находятся строчки текста легко по изменению концентрации черных точек. А вот что делать, если текст не "нормальный"?


 
tesseract ©   (2009-04-01 14:32) [1]


> А вот что делать, если текст не "нормальный"?


Нормализовать. Алгоритмы распознавания текста - это не для курсовая работа. Можешь скачать исходники tesseract и просмотреть, что там HP написала.


 
@!!ex ©   (2009-04-01 14:33) [2]

Кто нибудь пробовал.
Ваша задача довольно проста и сводится к грубой векторизации рисунка, когда строка текста представляется прямой линией. В эту сторону рекомендую копать. Inkscape умеет векторизовать рисунки и он OpenSource. Удачи.



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2009.05.31;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.44 MB
Время: 0.005 c
15-1238128193
Ламо777
2009-03-27 07:29
2009.05.31
Установка SVN-сервера на Windows


4-1210452824
sargast
2008-05-11 00:53
2009.05.31
Pipe


15-1237877089
{RASkov}
2009-03-24 09:44
2009.05.31
Настройка сетевого принтера


15-1238103365
Юрий
2009-03-27 00:36
2009.05.31
С днем рождения ! 27 марта 2009 пятница


9-1180082560
@!!ex
2007-05-25 12:42
2009.05.31
Переброска изображения между Рендеринг Таргетами.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский