Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2014.06.08;
Скачать: CL | DM;

Вниз

Распознать рукописный текст (преимущественно цифры)   Найти похожие ветки 

 
Артем Билецкий   (2013-11-25 19:01) [0]

Кто-нибудь в курсе как сделать? Может, что готовое есть (платное/бесплатное). Компоненты, библиотеки, да что угодно.

Спасибо


 
brother ©   (2013-11-25 19:38) [1]

fine reader с задачей справляется?


 
все арамисы, а я Дартаньян   (2013-11-25 21:07) [2]


> Кто-нибудь в курсе как сделать? Может, что готовое есть
> (платное/бесплатное). Компоненты, библиотеки, да что угодно.
Та там всё просто… Очищаем от высокочастотного шума, сегментируем, строим скелетную модель (методом выгорания, к примеру), отбрасываем конечные сегменты, загоняем в классификатор… *сатанинский смех*


 
все арамисы, а я Дартаньян   (2013-11-25 21:09) [3]

а вообще у файн-ридера был ком-интерфейсец, который всё это позволяет. вот буквально так, вызовом четырёх процедур. только там какие-то злые ограничения были в десктопной версии.


 
RDen ©   (2013-11-25 21:38) [4]


> Артем Билецкий   (25.11.13 19:01)
>
> Кто-нибудь в курсе как сделать?


нобелевскую хочешь получить?


 
KilkennyCat ©   (2013-11-25 21:56) [5]


> преимущественно цифры

во-первых, если даже хоть одна буква - то уже пофиг "преимущественно".
во-вторых, римский цифры - буквенны
в-третьих, общему алгоритму пофиг, что распознавать.


> да что угодно.


с каждым сканером в комплекте дпется версия какой-нить программы.
ну и напоследок: http://lmgtfy.com/?q=ocr


 
RDen ©   (2013-11-25 22:14) [6]


> KilkennyCat ©   (25.11.13 21:56) [5]
>
>
> > преимущественно цифры


а под цифрами, наверно ещё и числа подразумеваются...


 
robt5   (2013-11-25 22:43) [7]

в винде какбы есть рукописный ввод уже давно и соответствующие интерфейсы


 
все арамисы, а я Дартаньян   (2013-11-25 23:03) [8]


> в винде какбы есть рукописный ввод уже давно и соответствующие
> интерфейсы
рукописный ввод и распознавание сканов — это очень разные задачи. а что нужно топикстартеру, пока неясно.


 
Person ©   (2013-11-26 00:47) [9]

Сложно и дорого.

Из всех виденных мною решений с рукописным лучше всех справляется параскрипт. Если писатель может попадать в ячейку, то можно достичь весьма неплохих результатов (даже 99%, для чисел).

http://www.parascript.com

Тоже самое, но на русском: http://idr.in.ua
В картинках: http://idr.in.ua/info/scheme-formxtra.html


 
Артем Билецкий   (2013-11-26 11:45) [10]

1. FN не справляется. Пробовал
2. Распознавание сканов (документов, которые будут отсканированы)
3. Числа (0..999)


 
брат Птибурдукова   (2013-11-26 12:14) [11]


> 1. FN не справляется. Пробовал
FN — это Fine Reader?
Попробуй ещё Abbyy Form Reader. После настройки "поле числовое" и "заполнял русский" процент успешных распознаваний сильно вырастет.


 
Артем Билецкий   (2013-11-26 12:26) [12]


> Попробуй ещё Abbyy Form Reader.


Снят с поддержки по описанию. На счет "сильно выростает". Можно подробнее? Насколько сильно?


 
брат Птибурдукова   (2013-11-26 12:44) [13]

Ну на курсах распознавание "просто каких-то закорючек" давало около 20% распознанных символов. После настройки "здесь записаны цифры, а не что попало" стало около 80% распознанных цифр. (Для текстовых полей там ещё задаётся язык заполнения, но нам это неинтересно.)  После настройки "культуры заполнителя" (ну или что-то в таком плане) распознавать стало около 95-98%%.

Но надо понимать, что на обучении и в бою результаты могут быть сильно разными.


 
Артем Билецкий   (2013-11-26 12:49) [14]


> После настройки "культуры заполнителя" (ну или что-то в
> таком плане) распознавать стало около 95-98%


Это 95-98% правильных ответов. Или 95%-98% ответов, которые, возможно, еще и содержат ошибки?

А остальные 5-3% куда?


 
брат Птибурдукова   (2013-11-26 12:56) [15]


> Артем Билецкий   (26.11.13 12:49) [14]
Честно — не особо помню уже. Насколько я помню, часть цифр подсвечивалась "возможно, распознано неправильно" (и около трети действительно было неправильно), остальные были нераспознаны. В тех, которые система объявила "уверенно распознанными", ошибок не находил.


 
[ВладОшин] ©   (2013-11-27 20:52) [16]

http://cognitiveforms.ru/products/cuneiform/
если будете смотреть и поможет, отпишитесь плиз


 
Person ©   (2013-11-28 01:44) [17]


> http://cognitiveforms.ru/products/cuneiform/
> если будете смотреть и поможет, отпишитесь плиз


А что там смотреть? Необходимо отсканировать десяток листов и послать во все 3 конторы. Ну а дальше смотреть на точность и процент ручного ввода. Как бы, все.

Из описанного мною случая выше было следующее:
1) объем 1000-1500 страниц в неделю
2) результат распознавания любой недели всегда выше 99%. Обычно по разному, т.к. новые люди приходят/уходят (что-то типа 99,2-99,3).
3) порядка 10% всегда идет на проверку человеком

Из интересного. Руководство не устроил результат в 99,2 (для понимания, это 2-3 ошибки на 500 ячеек рукописного). Посадили несколько бабушек на проверку)))
Потом решили, что и бабушки долго проверяют. Ввели контрольную ячейку. В итоге, одна бабушка могла преврать из 99,3% в 100% за 1 час.
Что-то типа такого: http://idr.in.ua/info/docscorrection.html


 
Person ©   (2013-11-28 02:04) [18]


> В итоге, одна бабушка могла преврать из 99,3% в 100% за
> 1 час.


=превратить ))


 
Person ©   (2013-11-28 02:05) [19]


> В итоге, одна бабушка могла преврать из 99,3% в 100% за
> 1 час.


=превратить ))


 
Inovet ©   (2013-11-28 04:44) [20]

Контрольная сумма нужна.



Страницы: 1 вся ветка

Текущий архив: 2014.06.08;
Скачать: CL | DM;

Наверх




Память: 0.51 MB
Время: 0.007 c
15-1385361541
Igor_
2013-11-25 10:39
2014.06.08
"Обучалка" работы с программой. Какие есть готовые решения?


15-1385391687
Артем Билецкий
2013-11-25 19:01
2014.06.08
Распознать рукописный текст (преимущественно цифры)


15-1385152203
Юрий
2013-11-23 00:30
2014.06.08
С днем рождения ! 23 ноября 2013 суббота


1-1324888140
DmitriyG.
2011-12-26 12:29
2014.06.08
Delphi XE2 + DecompressDeflate


15-1385393065
Абориген
2013-11-25 19:24
2014.06.08
Простая задачка