Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2004.02.17;
Скачать: [xml.tar.bz2];

Вниз

Delphi jpg to text   Найти похожие ветки 

 
Алексей   (2004-02-06 10:51) [0]

Здравствуйте!

Подскажите пожалуйста исходник или методику,
чтения текста из картинок.

С уважением.


 
tria   (2004-02-06 11:04) [1]

Может ты имел ввиду распознавание текста? Так так и задай вопрос, а то и до орешника недалеко.


 
Reindeer Moss Eater   (2004-02-06 11:06) [2]

Может ты имел ввиду распознавание текста?

А зачем распознавать текст? Его читать надо.
Распознавать надо графические образы.


 
Алексей   (2004-02-06 11:10) [3]

Именно так, текст с jpg картинки надо распознать и прочитать программой.


 
Тимохов   (2004-02-06 11:16) [4]

Может речь про стеганографию?


 
KSergey   (2004-02-06 11:21) [5]

Методику общую - могу.
Однако учтите, что над конкретными реализациями (т.е. алгоритмами) работают целые научные коллективы - вы это потянете? А они с вами поделятся, как вы думаете?

В общих словах примерно так.
Для не омнифонтового распознавания можно использовать классический корреляционный анализ (храним идеальные изображения всех букв, подбираем ту, для которой корреляционная ф-ция максимальна; возможно, делаем нечуствительным к масштабу - но это уже детали).

А вот если нужен а-ля файн-ридер - то тут уже надо по сути описывать объект (взаимное расположение составляющих его элементов, их относительные размеры и конфигурацию: прямые, дуги и т.д.), и уже для них составлять словарь, по которому все это распознавать (опять же вычисляем корреляционную ф-цию). Но учитывая тот факт, что при станировании реального текста возникают помехи (развы, утолщения/утоньшения линий, неоднородность яркостей, смазы и т.д.) - задача сия ой как нетривиальна!

Если действительно хочется что-то попробовать - берем следующий двухтомник и читаем...

Дуда, Харт
"Распознавание образов и анализ сцен" (изд. Мир, если не ошибаюсь, год издания где-то 1978-79 или около того)


 
KSergey   (2004-02-06 11:35) [6]

Ради любопытства поискал данную книгу в инете - во всяком случае совместно с ней упоминается множество различных книг аналогичной тематики - читать - не перечитать! ;)


 
Алексей   (2004-02-06 11:44) [7]

Спасибо!

Вобщем-то нужно, прочитать не любой, а определенный "ровный"
шрифт.

Как в случае на почтовых ящиках существует защита от автоматических регистраций, для этого они искажают текст,
что сложно прочитать даже человеку, но теи не менее некоторые программы с этим справляются.


 
KSergey   (2004-02-06 11:50) [8]

Если заранее знать каким искажениям подвергается изображение (а в указанных случаях это именно так и есть: можно несколько раз позаходить, посмотреть) - то все существенно упрощается
Однако, если работаем именно с реально сканированным текстом - то все существено сложнее.

А для какого-то одного шрифта - вообще все проще.


 
Алексей   (2004-02-06 11:56) [9]

Да-да именно для определенного шрифта, причем не обладающим
особым изяществом.

Но все же как, какими компонентами пользоваться,
какой метод чтения для этого лучше использовать?


 
icWasya   (2004-02-06 12:31) [10]

а Вы случайно не про это
http://www.computerra.ru/focus/coment/31865/print.html


 
KSergey   (2004-02-06 13:00) [11]

> [9] Алексей (06.02.04 11:56)
> Но все же как, какими компонентами пользоваться,

TMozgi

> какой метод чтения для этого лучше использовать?

не понял, о каком чтении идет речь?
Вы бы хоть кратко пробежали книжки/статейки, чтобы хоть примерно быть в курсе проблематики...



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2004.02.17;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.47 MB
Время: 0.009 c
11-53443
Boguslaw
2003-05-29 00:00
2004.02.17
One crazy idea...


9-53351
miek
2003-07-28 10:31
2004.02.17
2D-движок: релиз


14-53699
Gero
2004-01-29 23:16
2004.02.17
Цвета в интерфейсе Office XP


8-53663
Tik
2003-10-15 16:13
2004.02.17
расширение фотки


1-53484
zamkom
2004-02-05 17:29
2004.02.17
Формат даты





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский