Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.06.10;
Скачать: CL | DM;

Вниз

Может кто делал распознавание текста и картинок?   Найти похожие ветки 

 
Brandik ©   (2006-09-25 03:06) [0]

Вообщем задача следующая:
есть отсканированный лист (А4) с текстом и картинками

нужно выделить области с текстом и с картинками...

есть предложения? текстурный анализ?


 
BATR   (2006-09-25 10:28) [1]

Вот тут посмотри, может поможет http://www.delphikingdom.com/asp/viewitem.asp?catalogid=1203


 
Сергей М. ©   (2006-09-25 10:30) [2]


> есть предложения?


Есть - не изобретать велосипед, а воспользоваться готовым OCR-софтом, например, FineReader"ом. Будучи OLE-сервером автоматизации, он имеет SDK и позволяет программное управление процессом распознавания и сохранения результатов оного.


 
Sambrook ©   (2006-09-25 13:38) [3]


> Есть - не изобретать велосипед, а воспользоваться готовым
> OCR-софтом, например, FineReader"ом. Будучи OLE-сервером
> автоматизации, он имеет SDK и позволяет программное управление
> процессом распознавания и сохранения результатов оного.

У него денег не хватит :)


 
clickmaker ©   (2006-09-25 15:10) [4]

есть еще MS Office Document Scaning / Imaging. Сильно подозреваю, что тоже можно через COM прицепиться.


 
Brandik ©   (2006-09-28 22:10) [5]

Блян за дурака не держите :)))
мне самому запрограмировать надо. :)
Текстурный анализ и все такое...


 
@!!ex ©   (2006-09-29 10:11) [6]

Не нужно изобретать велосипед.
Для распознавания текста и образов - нейросети.
Лучше еще не придумали, и врядли придумают.
ФайнРидер как раз на нейросетях сделан.

Там все не сложно, думаю за месяцок разберешся.
Если че, помогу на практике.
Редактор нейросетей могу продать. :))


 
Sambrook ©   (2006-09-29 13:24) [7]


> Не нужно изобретать велосипед.
> Для распознавания текста и образов - нейросети.
> Лучше еще не придумали, и врядли придумают.

3*Ха


> ФайнРидер как раз на нейросетях сделан.

Не знаю насчет последних версий, до 5 включительно использовался другой принцип.


Редактор нейросетей могу продать. :))

Их и бесплатных полно.

Зачем автору нейросеть, если ему просто нужно сегментировать изображение на области текста и картинок?


 
Pavia ©   (2006-09-29 17:09) [8]


> Зачем автору нейросеть, если ему просто нужно сегментировать
> изображение на области текста и картинок?

А как можно, сегментировать изображения не произведя распознования текста? Вернее я только так могу представить распознаем текст - это текст что не распозналось - это картинка.

ПС. Не думаю, что НС лучший вариант.


 
@!!ex ©   (2006-09-29 17:32) [9]

Sambrook ©   (29.09.06 13:24) [7]
Pavia ©   (29.09.06 17:09) [8]
Нс - быстро, просто, надежно, универсально.


 
Sambrook ©   (2006-09-29 18:35) [10]

to !!ex

> Нс - быстро

Обученная - да
Само обучение может быть очень длительным


>просто

Реализация обученной сети - да. Обучение - нет.


> надежно

Надежность определяется размером и репрезентативностью обучающей выборки.


 
Sambrook ©   (2006-09-29 18:40) [11]


> Pavia ©   (29.09.06 17:09) [8]
> А как можно, сегментировать изображения не произведя распознования
> текста?


Автор молчит как партизан, но судя по тому, что он изложил в перво посте ему не нужно распознавать отдельные символы, а только выделить подобласти, содержащую текст и картинки.
НС тут совсем не причем.


> Вернее я только так могу представить распознаем екст - это текст что не распозналось - это картинка.

Неверно. Могут быть пустые области - ни то и ни другое.


 
Stexen ©   (2006-09-29 19:43) [12]


> Для распознавания текста и образов - нейросети.

Ну вот слышал что вейвлет используются для разделения сигнала и определения символа, но точно не уверен...

а вообще если надо отделить текст от картинки, то все зависит от харахтера картинки если пейзаж какой нибудь и тд( ну полноцветная фотография) то проще некуда, а если схемы, то надо конечно посильнее трудится, тут то как раз на помощь и придут НС


 
Sambrook ©   (2006-09-29 19:49) [13]


> Stexen ©   (29.09.06 19:43) [12]
> а вообще если надо отделить текст от картинки, то все зависит
> от харахтера картинки если пейзаж какой нибудь и тд( ну
> полноцветная фотография) то проще некуда, а если схемы,
> то надо конечно посильнее трудится, тут то как раз на помощь
> и придут НС

Ну-ну. Лет за 10 глядишь НС и обучится :)


 
@!!ex ©   (2006-09-29 20:17) [14]

Ну почему 10 лет?
Обучали персептрон из 3 слов по 500 нейронов всего за месяц, причем на 4 обычных компах.


 
SamBrook ©   (2006-09-29 21:08) [15]


> Обучали персептрон из 3 слов по 500 нейронов всего за месяц,
>  причем на 4 обычных компах.

500 всего или в каждом слое? И на скольких объектах обучались?


 
@!!ex ©   (2006-09-29 21:15) [16]

В каждом, естественно.
500 обучений.
15000 эпох.


 
Multy   (2006-09-29 23:50) [17]


> Вот тут посмотри, может поможет http://www.delphikingdom.
> com/asp/viewitem.asp?catalogid=1203


Проверено, нехрена не работает


 
Stexen ©   (2006-09-30 13:13) [18]

А все таки где автор поста....
а то тут теории можно бесконечно развивать, что ж ему нужно все таки?


 
Vovan#1   (2006-10-01 23:38) [19]

>Проверено, нехрена не работает

То, что там представлено, не работает как заявлено. Автор учит сеть на печатном шрифте, а ждёт ручной ввод. Но пример всё равно хороший для начинающих.



Страницы: 1 вся ветка

Текущий архив: 2007.06.10;
Скачать: CL | DM;

Наверх




Память: 0.51 MB
Время: 0.027 c
2-1179386388
Alex7
2007-05-17 11:19
2007.06.10
Запрос с использованием имен других dataset (виртуальных таблиц)


15-1179140715
oldman
2007-05-14 15:05
2007.06.10
Я вышел из леса...


2-1179516298
LoRd1
2007-05-18 23:24
2007.06.10
Запуск програмы на выполнение


15-1179042617
Ravshan
2007-05-13 11:50
2007.06.10
C++ Файловые потоки: read, write. Странные вещи происходят.


2-1179386732
News
2007-05-17 11:25
2007.06.10
Сетевая игрушка