Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2003.06.09;
Скачать: [xml.tar.bz2];

Вниз

Проблема узнавания   Найти похожие ветки 

 
Soft   (2003-05-23 12:45) [0]

Есть у нас некоторый рисунок(RGB), на котором на цветном фоне другим цветом напечаны буквы или некоторые "цветные пятна". Причем белые буквы могут быть на черном фоне или наоборот. Необходимо отделить текст от фона и создать матрицу, в которой мы будем держать пиксельный рисунок букв или хотя бы сделать прямоугольное выделение этих букв. Как такое можно сделать?

PS
Слышал, что данная проблема не решаема в общем виде(тест Бонгарда). Это вам не TButton на TForm поместить:)


 
MBo   (2003-05-23 13:26) [1]

Нужно подобрать подходяший фильтр, позволяюший выделить цветовые переходы.


 
Soft   (2003-05-23 13:33) [2]

>>MBo © (23.05.03 13:26)
>>Нужно подобрать подходяший фильтр, позволяюший выделить цветовые переходы.

Вот и я о том же... только на сегодняшний день никто это фильтр не семел подобрать:( За это даже премия ~10000$(Бонгарда) назначена и всемирное научное признание:)


 
KSergey   (2003-05-23 13:38) [3]

Тааакк...
Народ начал писать автоматические регистрилки для mail.ru...


 
KSergey   (2003-05-23 13:40) [4]

А интересно, кому-нибудь это надо? Я бы однако взялся (в приложении в картинкам на mail).. Интересно...
Причем там ничего особенного, по моему: цифры всегда отдельным цветом, без переходов. Так что ничего страшного, если я все правильно понимаю...


 
MBo   (2003-05-23 13:44) [5]

универсального фильтра, конечно, не найти. Наверняка в твоем случае есть конкретные ограничения, облегчающие задачу - например, однородный (в каких-то пределах) фон или что-то еще.

некоторые из подобных алгоритмов:
Intensity Thresholding
Boundary Detection
Contour Following
Edge Detection
Hough Transform


 
KSergey   (2003-05-23 13:49) [6]

А вообще-то зря я погорячился... Однако на mail.ru уже существенно усложнили картинку... Теперь на драной козе к ним уже не подъедешь - думать надо, однако... ;)


 
MBo   (2003-05-23 13:52) [7]

>KSergey
а о чем речь относительно mail.ru?


 
Soft   (2003-05-23 13:57) [8]

>>KSergey © (23.05.03 13:38)
>>Тааакк...
>>Народ начал писать автоматические регистрилки для mail.ru...

Всего лишь банальный аналог FineReader(бесплатный, в исходных кодах, на Делфи). Так что если кто-то хочет подумать о алгоритмах, то можете присоединятся(запрограмирую я все сам). А модуль распознавания отдельных символов(в ужасном состоянии) у меня на сайте выложен.


 
KSergey   (2003-05-23 14:07) [9]

> MBo © (23.05.03 13:52)

На mail.ru при регистрации ящика примерно с год назад (или больше) ввели обязательный пункт "защита от автоматической регистрации". Там идет картинка, число с которой надо вписать в поле.
Аналогичные защиты сейчас делают на многих сайтах отправки сообщений на сотовые и пейджеры.


 
Soft   (2003-05-23 14:35) [10]

>>KSergey © (23.05.03 14:07)
>>> MBo © (23.05.03 13:52)

>>На mail.ru при регистрации ящика примерно с год назад (или больше) ввели обязательный пункт "защита от автоматической регистрации". Там идет картинка, число с которой надо вписать в поле.
>>Аналогичные защиты сейчас делают на многих сайтах отправки сообщений на сотовые и пейджеры.

Я про это даже не подозревал:) Так это ж все(защиту по картинкам) можно взломать.... все молчу, молчу, ай нехороший Soft:) Модератор не дремлет:)


 
Карелин Артем   (2003-05-23 14:52) [11]

А что за тест Бонгарда такой? можно подробнее?
А то я через полгода буду штурмовать распознавание символов.


 
Ihor Osov'yak   (2003-05-23 15:38) [12]

2 Soft © (23.05.03 14:35)

Чтобы оптимизма поубавилось - нужно сходить


http://edit.yahoo.com/config/eval_register?new=1&.src=pers&.v=4&.intl=us&.done=http%3a//personals.yahoo.com/display%3fct_hft=billingsplash%26.done=http%253A%252F%252Fpersonals.yahoo.com%26pricetype=old%26plan=monthly%26frlgn=1%26rv=1053689582

Зы - если линк не работает - не знаю, может там номер сессии - то " http://personals.yahoo.com";
- а там далее на подписку.

И сделать несколько раз рефреш на той страничке, где антиспам код вводить нужно..



 
KSergey   (2003-05-23 15:47) [13]

> Ihor Osov"yak © (23.05.03 15:38)

Вообще-то на mail покруче, как мне кажется... Там и цифры не в один ряд, да еще иногда наложенные, плюс каемочку они ой какую запупенили, хрен ее отделишь, да и отделить не всегда нужно -скорее наоборот в объект ее надо включить, а выделить ее.... похоже, они каемочкой часть контура цифры заменяют, т.к. иногда цифра и вовсе разваливается, а отдельные ее части объеденены лишь каемочкой. Единственное что было общего на mail - цифры всегда черные. Хотя и не факт, что так будет всегда. Правда и на указанной ссылке попалась мне один раз картиночка - ой-ей-ей: цифры размыты, да еще фон вокруг такой же размытый...


 
Ihor Osov'yak   (2003-05-23 15:51) [14]

2 KSergey © (23.05.03 15:47)

на майл я не смотрел, но прикол яху в том, что они всегда разные фильтры (или разную комбинацию фильтров) используют для искажения, и с рандомными параметрами.. Я не зря говорил про рефреш несколько раз.. К одному-двум фильтрам можно приспособиться, для случая с яху - это сложнее...


 
Soft   (2003-05-23 22:38) [15]

>>Карелин Артем © (23.05.03 14:52)
>>А что за тест Бонгарда такой? можно подробнее?
>>А то я через полгода буду штурмовать распознавание символов.

http://www.cs.indiana.edu/~hfoundal/research.html

ЗЫ
Это чтоб энтузиазма поуменьшилось:)


 
Плохой человек   (2003-05-23 23:29) [16]

Да как невиг делать. Что я, букву распознать не смогу. По примитивам. Вот есть у меня буква определённого шрифта, аточне ещё матрица, чёрно-белый рисунок. Что я делаю? Я сканирую ряд изображения, ищу границы цветов. Если нахожу границу, то иду дальше, соотнося полученные данные с моей матрицей. Если цвет предполагаемой буквы совпадёт с цветом снаружи (по вертикали и горизонтали), то это не буква, а г.... При этом, я определяю переход цветов буквы и сравниваю окружающую обстановку с новым цветом.


 
Soft   (2003-05-24 11:06) [17]

>>Плохой человек (23.05.03 23:29)
>>Да как невиг делать. Что я, букву распознать не смогу.


Ты не только Плохой человек, но и глупый человек:) Попробуй распознать, исходники в кладовку. Делферы тебя не забудут:)


 
Садист Петенька   (2003-05-24 12:03) [18]

Вот как правильно думать о проблемах распознавания вообще:
Познающий субъект - это вычислительная машина, а результат распознавания - программа для неё, исполнив которую, получим исходные данные, то есть картинку.
Наиболее короткая программа - более вероятна, чем длинная (по алгоритмической теории информации).

То есть, из двух вариантов распознавания вроде "то, что я вижу - случайный набор пикселей таких, как..." и "то, что я вижу - рисунок (RGB), на котором на цветном фоне другим цветом напечаны буквы или некоторые цветные пятна, а именно..." - выбирается второй, как гораздо более короткий и наиболее вероятный. Но для этого в системе команд машины должны быть - или сформироваться в результате предварительного обучения - такие концепции, как "буква", "цветной фон", "цветные пятна", и т.д.


 
KSergey   (2003-05-24 14:33) [19]

> Ihor Osov"yak © (23.05.03 15:51)
> 2 KSergey © (23.05.03 15:47)
> на майл я не смотрел, но прикол яху в том, что они всегда
> разные фильтры (или разную комбинацию фильтров) используют
> для искажения, и с рандомными параметрами.. Я не зря говорил
> про рефреш несколько раз.. К одному-двум фильтрам можно
> приспособиться, для случая с яху - это сложнее...

А вы посмотрите на mail. Мало того, что картинка цветная (пусть это не качественное, а количественное усложнение, но все же), дак еще и каемочка с меняющимся цветоом, как я упоминал. А то что фильтры разные - так оно понятно

> Плохой человек (23.05.03 23:29)
> Да как невиг делать. Что я, букву распознать не смогу. По

Ну-ну ;))
Вся ваша "теория" хороша для идеальных картинок, где нет помех. В таких условиях действительно нефиг делать распознавалки строить. А вот когда есть помехи (они же искажения) - тут все намноооого сложнее.


 
Садист Петенька   (2003-05-24 15:38) [20]

Для подхода, основанного на минимальной длине описания по отношению к универсальной вычислительной машине, все эти помехи (они же искажения) - нипочём.



Страницы: 1 вся ветка

Форум: "Потрепаться";
Текущий архив: 2003.06.09;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.014 c
14-26701
PelMen
2003-05-20 15:25
2003.06.09
Задача коммивояжера


14-26733
Subdigger
2003-05-21 12:25
2003.06.09
EOLESYSERROR


6-26648
Provodnick
2003-04-06 21:28
2003.06.09
Как получить имя компьютера в сети и рабочую группу?


1-26475
Raduga
2003-05-29 13:29
2003.06.09
Копирование большого файла


1-26524
Renul
2003-05-24 19:01
2003.06.09
Читать с MEMO





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский