Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Media";
Текущий архив: 2007.06.10;
Скачать: [xml.tar.bz2];

Вниз

Может кто делал распознавание текста и картинок?   Найти похожие ветки 

 
Brandik ©   (2006-09-25 03:06) [0]

Вообщем задача следующая:
есть отсканированный лист (А4) с текстом и картинками

нужно выделить области с текстом и с картинками...

есть предложения? текстурный анализ?


 
BATR   (2006-09-25 10:28) [1]

Вот тут посмотри, может поможет http://www.delphikingdom.com/asp/viewitem.asp?catalogid=1203


 
Сергей М. ©   (2006-09-25 10:30) [2]


> есть предложения?


Есть - не изобретать велосипед, а воспользоваться готовым OCR-софтом, например, FineReader"ом. Будучи OLE-сервером автоматизации, он имеет SDK и позволяет программное управление процессом распознавания и сохранения результатов оного.


 
Sambrook ©   (2006-09-25 13:38) [3]


> Есть - не изобретать велосипед, а воспользоваться готовым
> OCR-софтом, например, FineReader"ом. Будучи OLE-сервером
> автоматизации, он имеет SDK и позволяет программное управление
> процессом распознавания и сохранения результатов оного.

У него денег не хватит :)


 
clickmaker ©   (2006-09-25 15:10) [4]

есть еще MS Office Document Scaning / Imaging. Сильно подозреваю, что тоже можно через COM прицепиться.


 
Brandik ©   (2006-09-28 22:10) [5]

Блян за дурака не держите :)))
мне самому запрограмировать надо. :)
Текстурный анализ и все такое...


 
@!!ex ©   (2006-09-29 10:11) [6]

Не нужно изобретать велосипед.
Для распознавания текста и образов - нейросети.
Лучше еще не придумали, и врядли придумают.
ФайнРидер как раз на нейросетях сделан.

Там все не сложно, думаю за месяцок разберешся.
Если че, помогу на практике.
Редактор нейросетей могу продать. :))


 
Sambrook ©   (2006-09-29 13:24) [7]


> Не нужно изобретать велосипед.
> Для распознавания текста и образов - нейросети.
> Лучше еще не придумали, и врядли придумают.

3*Ха


> ФайнРидер как раз на нейросетях сделан.

Не знаю насчет последних версий, до 5 включительно использовался другой принцип.


Редактор нейросетей могу продать. :))

Их и бесплатных полно.

Зачем автору нейросеть, если ему просто нужно сегментировать изображение на области текста и картинок?


 
Pavia ©   (2006-09-29 17:09) [8]


> Зачем автору нейросеть, если ему просто нужно сегментировать
> изображение на области текста и картинок?

А как можно, сегментировать изображения не произведя распознования текста? Вернее я только так могу представить распознаем текст - это текст что не распозналось - это картинка.

ПС. Не думаю, что НС лучший вариант.


 
@!!ex ©   (2006-09-29 17:32) [9]

Sambrook ©   (29.09.06 13:24) [7]
Pavia ©   (29.09.06 17:09) [8]
Нс - быстро, просто, надежно, универсально.


 
Sambrook ©   (2006-09-29 18:35) [10]

to !!ex

> Нс - быстро

Обученная - да
Само обучение может быть очень длительным


>просто

Реализация обученной сети - да. Обучение - нет.


> надежно

Надежность определяется размером и репрезентативностью обучающей выборки.


 
Sambrook ©   (2006-09-29 18:40) [11]


> Pavia ©   (29.09.06 17:09) [8]
> А как можно, сегментировать изображения не произведя распознования
> текста?


Автор молчит как партизан, но судя по тому, что он изложил в перво посте ему не нужно распознавать отдельные символы, а только выделить подобласти, содержащую текст и картинки.
НС тут совсем не причем.


> Вернее я только так могу представить распознаем екст - это текст что не распозналось - это картинка.

Неверно. Могут быть пустые области - ни то и ни другое.


 
Stexen ©   (2006-09-29 19:43) [12]


> Для распознавания текста и образов - нейросети.

Ну вот слышал что вейвлет используются для разделения сигнала и определения символа, но точно не уверен...

а вообще если надо отделить текст от картинки, то все зависит от харахтера картинки если пейзаж какой нибудь и тд( ну полноцветная фотография) то проще некуда, а если схемы, то надо конечно посильнее трудится, тут то как раз на помощь и придут НС


 
Sambrook ©   (2006-09-29 19:49) [13]


> Stexen ©   (29.09.06 19:43) [12]
> а вообще если надо отделить текст от картинки, то все зависит
> от харахтера картинки если пейзаж какой нибудь и тд( ну
> полноцветная фотография) то проще некуда, а если схемы,
> то надо конечно посильнее трудится, тут то как раз на помощь
> и придут НС

Ну-ну. Лет за 10 глядишь НС и обучится :)


 
@!!ex ©   (2006-09-29 20:17) [14]

Ну почему 10 лет?
Обучали персептрон из 3 слов по 500 нейронов всего за месяц, причем на 4 обычных компах.


 
SamBrook ©   (2006-09-29 21:08) [15]


> Обучали персептрон из 3 слов по 500 нейронов всего за месяц,
>  причем на 4 обычных компах.

500 всего или в каждом слое? И на скольких объектах обучались?


 
@!!ex ©   (2006-09-29 21:15) [16]

В каждом, естественно.
500 обучений.
15000 эпох.


 
Multy   (2006-09-29 23:50) [17]


> Вот тут посмотри, может поможет http://www.delphikingdom.
> com/asp/viewitem.asp?catalogid=1203


Проверено, нехрена не работает


 
Stexen ©   (2006-09-30 13:13) [18]

А все таки где автор поста....
а то тут теории можно бесконечно развивать, что ж ему нужно все таки?


 
Vovan#1   (2006-10-01 23:38) [19]

>Проверено, нехрена не работает

То, что там представлено, не работает как заявлено. Автор учит сеть на печатном шрифте, а ждёт ручной ввод. Но пример всё равно хороший для начинающих.



Страницы: 1 вся ветка

Форум: "Media";
Текущий архив: 2007.06.10;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.038 c
15-1179297538
IMHO
2007-05-16 10:38
2007.06.10
Сегодня - финал Кубка УЕФА!


1-1176617592
Major Gray
2007-04-15 10:13
2007.06.10
Нестандартная реакция TPopupMenu.


11-1161854783
Thaddy
2006-10-26 13:26
2007.06.10
kolnmck down?


15-1179324164
GeLLeR
2007-05-16 18:02
2007.06.10
Что-бы такого написать...


2-1179643152
А.Брей
2007-05-20 10:39
2007.06.10
Переменная





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский