Сканирование и распознавание стандартных документов.

← →
Alexxxx (2003-04-04 16:33) [0]

Здравствуйте.
Встала задача автоматизировать ввод данных с печатных форм. Пример - ввод
платежек.
Типа положил ее в сканер, нажал на кнопку в программе и получил готовый
бухгалтерский документ в местной ERP.
Задача программного сканирования в принципе решаемая. Осталось дело за
малым - распознать текст в полученной картинке, и "выдрать" из полученного
все поля платежки.
Понятно, что алгоритм распознавания не есть вещь открытая, т.к. в его
разработку вложено много кило-(мега-) денег и никто не желает этим просто
так делиться. Но, с другой стороны, уже есть в принципе (полу-?)готовые
решения, в виде программ по распознаванию текста. И задача может свестись к
"правильной" обертке этих программ.

В общем, кто чем может помочь?

← →
LongIsland (2003-04-04 16:45) [1]

Набери в поисковике преобразование Хоуга / Houg transformation. Это может облегчить жисть, но не очень :-)

← →
NickBat (2003-04-04 16:49) [2]

Мне кажется лучше использовать стандартные программы для таких целей, тем более, что они есть. Из готовых программных продуктов сохраняйте в файл и втягивайте в свою базу данных.

Правда есть одно НО.
Вы наверное согласитесь, что FineReader на данном этапе лучший из распознавателей.
Так вот,как-то приходилось сканировать довольно много листов, чтобы потом закачать данные в свою базу. Качество оригинала было приличное, но несмотря на это, при распозновании текста важную информацию (как-то суммы) приходилось контролировать глазками и, довольно, часто исправлять. А если вам надо платежки втягивать, причем на автомате, то уж не знаю...

Сканирование и распознавание стандартных документов. Найти похожие ветки