Форум: "Основная";
Текущий архив: 2003.04.17;
Скачать: [xml.tar.bz2];
ВнизСканирование и распознавание стандартных документов. Найти похожие ветки
← →
Alexxxx (2003-04-04 16:33) [0]Здравствуйте.
Встала задача автоматизировать ввод данных с печатных форм. Пример - ввод
платежек.
Типа положил ее в сканер, нажал на кнопку в программе и получил готовый
бухгалтерский документ в местной ERP.
Задача программного сканирования в принципе решаемая. Осталось дело за
малым - распознать текст в полученной картинке, и "выдрать" из полученного
все поля платежки.
Понятно, что алгоритм распознавания не есть вещь открытая, т.к. в его
разработку вложено много кило-(мега-) денег и никто не желает этим просто
так делиться. Но, с другой стороны, уже есть в принципе (полу-?)готовые
решения, в виде программ по распознаванию текста. И задача может свестись к
"правильной" обертке этих программ.
В общем, кто чем может помочь?
← →
LongIsland (2003-04-04 16:45) [1]Набери в поисковике преобразование Хоуга / Houg transformation. Это может облегчить жисть, но не очень :-)
← →
NickBat (2003-04-04 16:49) [2]Мне кажется лучше использовать стандартные программы для таких целей, тем более, что они есть. Из готовых программных продуктов сохраняйте в файл и втягивайте в свою базу данных.
Правда есть одно НО.
Вы наверное согласитесь, что FineReader на данном этапе лучший из распознавателей.
Так вот,как-то приходилось сканировать довольно много листов, чтобы потом закачать данные в свою базу. Качество оригинала было приличное, но несмотря на это, при распозновании текста важную информацию (как-то суммы) приходилось контролировать глазками и, довольно, часто исправлять. А если вам надо платежки втягивать, причем на автомате, то уж не знаю...
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2003.04.17;
Скачать: [xml.tar.bz2];
Память: 0.45 MB
Время: 0.008 c