Форум: "Основная";
Текущий архив: 2004.02.17;
Скачать: [xml.tar.bz2];
ВнизDelphi jpg to text Найти похожие ветки
← →
Алексей (2004-02-06 10:51) [0]Здравствуйте!
Подскажите пожалуйста исходник или методику,
чтения текста из картинок.
С уважением.
← →
tria (2004-02-06 11:04) [1]Может ты имел ввиду распознавание текста? Так так и задай вопрос, а то и до орешника недалеко.
← →
Reindeer Moss Eater (2004-02-06 11:06) [2]Может ты имел ввиду распознавание текста?
А зачем распознавать текст? Его читать надо.
Распознавать надо графические образы.
← →
Алексей (2004-02-06 11:10) [3]Именно так, текст с jpg картинки надо распознать и прочитать программой.
← →
Тимохов (2004-02-06 11:16) [4]Может речь про стеганографию?
← →
KSergey (2004-02-06 11:21) [5]Методику общую - могу.
Однако учтите, что над конкретными реализациями (т.е. алгоритмами) работают целые научные коллективы - вы это потянете? А они с вами поделятся, как вы думаете?
В общих словах примерно так.
Для не омнифонтового распознавания можно использовать классический корреляционный анализ (храним идеальные изображения всех букв, подбираем ту, для которой корреляционная ф-ция максимальна; возможно, делаем нечуствительным к масштабу - но это уже детали).
А вот если нужен а-ля файн-ридер - то тут уже надо по сути описывать объект (взаимное расположение составляющих его элементов, их относительные размеры и конфигурацию: прямые, дуги и т.д.), и уже для них составлять словарь, по которому все это распознавать (опять же вычисляем корреляционную ф-цию). Но учитывая тот факт, что при станировании реального текста возникают помехи (развы, утолщения/утоньшения линий, неоднородность яркостей, смазы и т.д.) - задача сия ой как нетривиальна!
Если действительно хочется что-то попробовать - берем следующий двухтомник и читаем...
Дуда, Харт
"Распознавание образов и анализ сцен" (изд. Мир, если не ошибаюсь, год издания где-то 1978-79 или около того)
← →
KSergey (2004-02-06 11:35) [6]Ради любопытства поискал данную книгу в инете - во всяком случае совместно с ней упоминается множество различных книг аналогичной тематики - читать - не перечитать! ;)
← →
Алексей (2004-02-06 11:44) [7]Спасибо!
Вобщем-то нужно, прочитать не любой, а определенный "ровный"
шрифт.
Как в случае на почтовых ящиках существует защита от автоматических регистраций, для этого они искажают текст,
что сложно прочитать даже человеку, но теи не менее некоторые программы с этим справляются.
← →
KSergey (2004-02-06 11:50) [8]Если заранее знать каким искажениям подвергается изображение (а в указанных случаях это именно так и есть: можно несколько раз позаходить, посмотреть) - то все существенно упрощается
Однако, если работаем именно с реально сканированным текстом - то все существено сложнее.
А для какого-то одного шрифта - вообще все проще.
← →
Алексей (2004-02-06 11:56) [9]Да-да именно для определенного шрифта, причем не обладающим
особым изяществом.
Но все же как, какими компонентами пользоваться,
какой метод чтения для этого лучше использовать?
← →
icWasya (2004-02-06 12:31) [10]а Вы случайно не про это
http://www.computerra.ru/focus/coment/31865/print.html
← →
KSergey (2004-02-06 13:00) [11]> [9] Алексей (06.02.04 11:56)
> Но все же как, какими компонентами пользоваться,
TMozgi
> какой метод чтения для этого лучше использовать?
не понял, о каком чтении идет речь?
Вы бы хоть кратко пробежали книжки/статейки, чтобы хоть примерно быть в курсе проблематики...
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2004.02.17;
Скачать: [xml.tar.bz2];
Память: 0.47 MB
Время: 0.009 c