Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.06.10;
Скачать: CL | DM;

Вниз

Может кто делал распознавание текста и картинок?   Найти похожие ветки 

 
Brandik ©   (2006-09-25 03:06) [0]

Вообщем задача следующая:
есть отсканированный лист (А4) с текстом и картинками

нужно выделить области с текстом и с картинками...

есть предложения? текстурный анализ?


 
BATR   (2006-09-25 10:28) [1]

Вот тут посмотри, может поможет http://www.delphikingdom.com/asp/viewitem.asp?catalogid=1203


 
Сергей М. ©   (2006-09-25 10:30) [2]


> есть предложения?


Есть - не изобретать велосипед, а воспользоваться готовым OCR-софтом, например, FineReader"ом. Будучи OLE-сервером автоматизации, он имеет SDK и позволяет программное управление процессом распознавания и сохранения результатов оного.


 
Sambrook ©   (2006-09-25 13:38) [3]


> Есть - не изобретать велосипед, а воспользоваться готовым
> OCR-софтом, например, FineReader"ом. Будучи OLE-сервером
> автоматизации, он имеет SDK и позволяет программное управление
> процессом распознавания и сохранения результатов оного.

У него денег не хватит :)


 
clickmaker ©   (2006-09-25 15:10) [4]

есть еще MS Office Document Scaning / Imaging. Сильно подозреваю, что тоже можно через COM прицепиться.


 
Brandik ©   (2006-09-28 22:10) [5]

Блян за дурака не держите :)))
мне самому запрограмировать надо. :)
Текстурный анализ и все такое...


 
@!!ex ©   (2006-09-29 10:11) [6]

Не нужно изобретать велосипед.
Для распознавания текста и образов - нейросети.
Лучше еще не придумали, и врядли придумают.
ФайнРидер как раз на нейросетях сделан.

Там все не сложно, думаю за месяцок разберешся.
Если че, помогу на практике.
Редактор нейросетей могу продать. :))


 
Sambrook ©   (2006-09-29 13:24) [7]


> Не нужно изобретать велосипед.
> Для распознавания текста и образов - нейросети.
> Лучше еще не придумали, и врядли придумают.

3*Ха


> ФайнРидер как раз на нейросетях сделан.

Не знаю насчет последних версий, до 5 включительно использовался другой принцип.


Редактор нейросетей могу продать. :))

Их и бесплатных полно.

Зачем автору нейросеть, если ему просто нужно сегментировать изображение на области текста и картинок?


 
Pavia ©   (2006-09-29 17:09) [8]


> Зачем автору нейросеть, если ему просто нужно сегментировать
> изображение на области текста и картинок?

А как можно, сегментировать изображения не произведя распознования текста? Вернее я только так могу представить распознаем текст - это текст что не распозналось - это картинка.

ПС. Не думаю, что НС лучший вариант.


 
@!!ex ©   (2006-09-29 17:32) [9]

Sambrook ©   (29.09.06 13:24) [7]
Pavia ©   (29.09.06 17:09) [8]
Нс - быстро, просто, надежно, универсально.


 
Sambrook ©   (2006-09-29 18:35) [10]

to !!ex

> Нс - быстро

Обученная - да
Само обучение может быть очень длительным


>просто

Реализация обученной сети - да. Обучение - нет.


> надежно

Надежность определяется размером и репрезентативностью обучающей выборки.


 
Sambrook ©   (2006-09-29 18:40) [11]


> Pavia ©   (29.09.06 17:09) [8]
> А как можно, сегментировать изображения не произведя распознования
> текста?


Автор молчит как партизан, но судя по тому, что он изложил в перво посте ему не нужно распознавать отдельные символы, а только выделить подобласти, содержащую текст и картинки.
НС тут совсем не причем.


> Вернее я только так могу представить распознаем екст - это текст что не распозналось - это картинка.

Неверно. Могут быть пустые области - ни то и ни другое.


 
Stexen ©   (2006-09-29 19:43) [12]


> Для распознавания текста и образов - нейросети.

Ну вот слышал что вейвлет используются для разделения сигнала и определения символа, но точно не уверен...

а вообще если надо отделить текст от картинки, то все зависит от харахтера картинки если пейзаж какой нибудь и тд( ну полноцветная фотография) то проще некуда, а если схемы, то надо конечно посильнее трудится, тут то как раз на помощь и придут НС


 
Sambrook ©   (2006-09-29 19:49) [13]


> Stexen ©   (29.09.06 19:43) [12]
> а вообще если надо отделить текст от картинки, то все зависит
> от харахтера картинки если пейзаж какой нибудь и тд( ну
> полноцветная фотография) то проще некуда, а если схемы,
> то надо конечно посильнее трудится, тут то как раз на помощь
> и придут НС

Ну-ну. Лет за 10 глядишь НС и обучится :)


 
@!!ex ©   (2006-09-29 20:17) [14]

Ну почему 10 лет?
Обучали персептрон из 3 слов по 500 нейронов всего за месяц, причем на 4 обычных компах.


 
SamBrook ©   (2006-09-29 21:08) [15]


> Обучали персептрон из 3 слов по 500 нейронов всего за месяц,
>  причем на 4 обычных компах.

500 всего или в каждом слое? И на скольких объектах обучались?


 
@!!ex ©   (2006-09-29 21:15) [16]

В каждом, естественно.
500 обучений.
15000 эпох.


 
Multy   (2006-09-29 23:50) [17]


> Вот тут посмотри, может поможет http://www.delphikingdom.
> com/asp/viewitem.asp?catalogid=1203


Проверено, нехрена не работает


 
Stexen ©   (2006-09-30 13:13) [18]

А все таки где автор поста....
а то тут теории можно бесконечно развивать, что ж ему нужно все таки?


 
Vovan#1   (2006-10-01 23:38) [19]

>Проверено, нехрена не работает

То, что там представлено, не работает как заявлено. Автор учит сеть на печатном шрифте, а ждёт ручной ввод. Но пример всё равно хороший для начинающих.



Страницы: 1 вся ветка

Текущий архив: 2007.06.10;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.069 c
15-1178788010
elserpiente
2007-05-10 13:06
2007.06.10
Профайлер под BDS2006


1-1176549475
gosha73
2007-04-14 15:17
2007.06.10
Утечка памяти в TOpenDialog?


15-1179251769
VirEx
2007-05-15 21:56
2007.06.10
I, robot.


3-1174570341
DelphiLexx
2007-03-22 16:32
2007.06.10
Динамическое создание полей в FIBDataSet e


2-1179489999
pleasehelp
2007-05-18 16:06
2007.06.10
как узнать количество строк в таблице mysql?





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский