Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2004.02.17;
Скачать: [xml.tar.bz2];

Вниз

Delphi jpg to text   Найти похожие ветки 

 
Алексей   (2004-02-06 10:51) [0]

Здравствуйте!

Подскажите пожалуйста исходник или методику,
чтения текста из картинок.

С уважением.


 
tria   (2004-02-06 11:04) [1]

Может ты имел ввиду распознавание текста? Так так и задай вопрос, а то и до орешника недалеко.


 
Reindeer Moss Eater   (2004-02-06 11:06) [2]

Может ты имел ввиду распознавание текста?

А зачем распознавать текст? Его читать надо.
Распознавать надо графические образы.


 
Алексей   (2004-02-06 11:10) [3]

Именно так, текст с jpg картинки надо распознать и прочитать программой.


 
Тимохов   (2004-02-06 11:16) [4]

Может речь про стеганографию?


 
KSergey   (2004-02-06 11:21) [5]

Методику общую - могу.
Однако учтите, что над конкретными реализациями (т.е. алгоритмами) работают целые научные коллективы - вы это потянете? А они с вами поделятся, как вы думаете?

В общих словах примерно так.
Для не омнифонтового распознавания можно использовать классический корреляционный анализ (храним идеальные изображения всех букв, подбираем ту, для которой корреляционная ф-ция максимальна; возможно, делаем нечуствительным к масштабу - но это уже детали).

А вот если нужен а-ля файн-ридер - то тут уже надо по сути описывать объект (взаимное расположение составляющих его элементов, их относительные размеры и конфигурацию: прямые, дуги и т.д.), и уже для них составлять словарь, по которому все это распознавать (опять же вычисляем корреляционную ф-цию). Но учитывая тот факт, что при станировании реального текста возникают помехи (развы, утолщения/утоньшения линий, неоднородность яркостей, смазы и т.д.) - задача сия ой как нетривиальна!

Если действительно хочется что-то попробовать - берем следующий двухтомник и читаем...

Дуда, Харт
"Распознавание образов и анализ сцен" (изд. Мир, если не ошибаюсь, год издания где-то 1978-79 или около того)


 
KSergey   (2004-02-06 11:35) [6]

Ради любопытства поискал данную книгу в инете - во всяком случае совместно с ней упоминается множество различных книг аналогичной тематики - читать - не перечитать! ;)


 
Алексей   (2004-02-06 11:44) [7]

Спасибо!

Вобщем-то нужно, прочитать не любой, а определенный "ровный"
шрифт.

Как в случае на почтовых ящиках существует защита от автоматических регистраций, для этого они искажают текст,
что сложно прочитать даже человеку, но теи не менее некоторые программы с этим справляются.


 
KSergey   (2004-02-06 11:50) [8]

Если заранее знать каким искажениям подвергается изображение (а в указанных случаях это именно так и есть: можно несколько раз позаходить, посмотреть) - то все существенно упрощается
Однако, если работаем именно с реально сканированным текстом - то все существено сложнее.

А для какого-то одного шрифта - вообще все проще.


 
Алексей   (2004-02-06 11:56) [9]

Да-да именно для определенного шрифта, причем не обладающим
особым изяществом.

Но все же как, какими компонентами пользоваться,
какой метод чтения для этого лучше использовать?


 
icWasya   (2004-02-06 12:31) [10]

а Вы случайно не про это
http://www.computerra.ru/focus/coment/31865/print.html


 
KSergey   (2004-02-06 13:00) [11]

> [9] Алексей (06.02.04 11:56)
> Но все же как, какими компонентами пользоваться,

TMozgi

> какой метод чтения для этого лучше использовать?

не понял, о каком чтении идет речь?
Вы бы хоть кратко пробежали книжки/статейки, чтобы хоть примерно быть в курсе проблематики...



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2004.02.17;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.47 MB
Время: 0.01 c
1-53579
PHENIX physicist
2004-02-09 14:54
2004.02.17
XML вместо INI


14-53715
Карелин Артем
2004-01-29 13:58
2004.02.17
Глюк?


14-53743
syte_ser78
2004-01-28 08:58
2004.02.17
Коаксиал и витая пара


3-53401
vovchik
2004-01-28 13:00
2004.02.17
ADO


6-53667
MoRo
2003-12-15 10:21
2004.02.17
IP name





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский