Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2004.02.17;
Скачать: CL | DM;

Вниз

Delphi jpg to text   Найти похожие ветки 

 
Алексей   (2004-02-06 10:51) [0]

Здравствуйте!

Подскажите пожалуйста исходник или методику,
чтения текста из картинок.

С уважением.


 
tria ©   (2004-02-06 11:04) [1]

Может ты имел ввиду распознавание текста? Так так и задай вопрос, а то и до орешника недалеко.


 
Reindeer Moss Eater ©   (2004-02-06 11:06) [2]

Может ты имел ввиду распознавание текста?

А зачем распознавать текст? Его читать надо.
Распознавать надо графические образы.


 
Алексей   (2004-02-06 11:10) [3]

Именно так, текст с jpg картинки надо распознать и прочитать программой.


 
Тимохов ©   (2004-02-06 11:16) [4]

Может речь про стеганографию?


 
KSergey ©   (2004-02-06 11:21) [5]

Методику общую - могу.
Однако учтите, что над конкретными реализациями (т.е. алгоритмами) работают целые научные коллективы - вы это потянете? А они с вами поделятся, как вы думаете?

В общих словах примерно так.
Для не омнифонтового распознавания можно использовать классический корреляционный анализ (храним идеальные изображения всех букв, подбираем ту, для которой корреляционная ф-ция максимальна; возможно, делаем нечуствительным к масштабу - но это уже детали).

А вот если нужен а-ля файн-ридер - то тут уже надо по сути описывать объект (взаимное расположение составляющих его элементов, их относительные размеры и конфигурацию: прямые, дуги и т.д.), и уже для них составлять словарь, по которому все это распознавать (опять же вычисляем корреляционную ф-цию). Но учитывая тот факт, что при станировании реального текста возникают помехи (развы, утолщения/утоньшения линий, неоднородность яркостей, смазы и т.д.) - задача сия ой как нетривиальна!

Если действительно хочется что-то попробовать - берем следующий двухтомник и читаем...

Дуда, Харт
"Распознавание образов и анализ сцен" (изд. Мир, если не ошибаюсь, год издания где-то 1978-79 или около того)


 
KSergey ©   (2004-02-06 11:35) [6]

Ради любопытства поискал данную книгу в инете - во всяком случае совместно с ней упоминается множество различных книг аналогичной тематики - читать - не перечитать! ;)


 
Алексей   (2004-02-06 11:44) [7]

Спасибо!

Вобщем-то нужно, прочитать не любой, а определенный "ровный"
шрифт.

Как в случае на почтовых ящиках существует защита от автоматических регистраций, для этого они искажают текст,
что сложно прочитать даже человеку, но теи не менее некоторые программы с этим справляются.


 
KSergey ©   (2004-02-06 11:50) [8]

Если заранее знать каким искажениям подвергается изображение (а в указанных случаях это именно так и есть: можно несколько раз позаходить, посмотреть) - то все существенно упрощается
Однако, если работаем именно с реально сканированным текстом - то все существено сложнее.

А для какого-то одного шрифта - вообще все проще.


 
Алексей   (2004-02-06 11:56) [9]

Да-да именно для определенного шрифта, причем не обладающим
особым изяществом.

Но все же как, какими компонентами пользоваться,
какой метод чтения для этого лучше использовать?


 
icWasya ©   (2004-02-06 12:31) [10]

а Вы случайно не про это
http://www.computerra.ru/focus/coment/31865/print.html


 
KSergey ©   (2004-02-06 13:00) [11]

> [9] Алексей (06.02.04 11:56)
> Но все же как, какими компонентами пользоваться,

TMozgi

> какой метод чтения для этого лучше использовать?

не понял, о каком чтении идет речь?
Вы бы хоть кратко пробежали книжки/статейки, чтобы хоть примерно быть в курсе проблематики...



Страницы: 1 вся ветка

Текущий архив: 2004.02.17;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.019 c
14-53689
вразлет
2004-01-30 15:04
2004.02.17
Открой окошко)


3-53366
Xmen
2004-01-28 08:23
2004.02.17
Перекодировка


4-53820
FBI
2003-12-08 09:41
2004.02.17
Активное окно


1-53446
dub
2004-02-09 13:48
2004.02.17
Работа с реестром


1-53487
Вованчик
2004-02-06 08:00
2004.02.17
Как исключить Qtintf70.dll из дистрибутива?