Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2006.11.12;
Скачать: [xml.tar.bz2];

Вниз

Поиск похожих jpg   Найти похожие ветки 

 
Чародей ©   (2006-10-22 12:08) [0]

Написал программку для поиска схожих jpg картинок. Если кого-то интересует то:
http://www.webfile.ru/1159828 (src D6 ~ 130Kb ). Интересуют предложения по оптимизации(да и вообще ваши мысли по поводу), а то у меня скорость получается очень медленная.


 
ANTPro ©   (2006-10-22 12:15) [1]

> [0] Чародей ©   (22.10.06 12:08)
>поиска схожих jpg картинок

И как определяется схожесть?


 
Чародей ©   (2006-10-22 12:20) [2]


> И как определяется схожесть?

4 процентными параметрами соответствия. Я выложил исходники, там и посмотреть можно


 
Ketmar ©   (2006-10-22 12:25) [3]

а можно куда-то на нормальный хостинг? недружба у меня с "выбфиле" %-(


 
ANTPro ©   (2006-10-22 12:26) [4]

> [2] Чародей ©   (22.10.06 12:20)
> 4 процентными параметрами соответствия

Кажись я на шел тему для своего курсовика ;)


 
Чародей ©   (2006-10-22 12:34) [5]


> Ketmar ©   (22.10.06 12:25) [3]
> а можно куда-то на нормальный хостинг? недружба у меня с
> "выбфиле" %-(

А что есть нормальный хостинг?


 
Ketmar ©   (2006-10-22 12:36) [6]

>[5] Чародей(c) 22-Oct-2006, 12:34
>А что есть нормальный хостинг?
да любой халявный. хоть "народру". %-)


 
ANTPro ©   (2006-10-22 12:38) [7]

> [5] Чародей ©   (22.10.06 12:34)
> А что есть нормальный хостинг?

slil.ru


 
Ketmar ©   (2006-10-22 12:40) [8]

>[7] ANTPro(c) 22-Oct-2006, 12:38
>slil.ru
"слив защитан". %-)


 
Чародей ©   (2006-10-22 12:44) [9]

http://slil.ru/23285500
с народом чет не понял


 
Virgo_Style ©   (2006-10-22 13:08) [10]

C ImgSearch (c) by Vladimir Kladov сравнивал?
Негативы, разные размеры отлавливает?

P.S. Вот бы кто написал такое для MP3...


 
Ketmar ©   (2006-10-22 13:11) [11]

>[10] Virgo_Style(c) 22-Oct-2006, 13:08
>P.S. Вот бы кто написал такое для MP3...
тебе и Delphi в руки %-)


 
Чародей ©   (2006-10-22 13:17) [12]


> C ImgSearch (c) by Vladimir Kladov сравнивал?

Нет.
> Негативы, разные размеры отлавливает?

Негативы нет (хотя я это запомню!).
Разные размеры - да. Поиск не идентичных, а похожих.
Поиск идентичных картинок, вооюще не имеет смысла(это и ACDSee умеет).


 
Kerk ©   (2006-10-22 13:36) [13]

> [0] Чародей ©   (22.10.06 12:08)

Стукни мне в аську плиз


 
Ученик чародея.   (2006-10-22 14:35) [14]

Попробуй на них БПФ натравить преобразовав все сперва в оттенки серого(1 байт) или же в отдельную матрицу. А затем сравнивать уже спектры.

Для Delphi код можно взять здесь http://alglib.sources.ru/fft/fft.php но там только одномерное преобразование, а вот для C здесь http://www.fftw.org/


 
@!!ex ©   (2006-10-22 14:42) [15]


> Virgo_Style ©   (22.10.06 13:08) [10]
> C ImgSearch (c) by Vladimir Kladov сравнивал?
> Негативы, разные размеры отлавливает?
>
> P.S. Вот бы кто написал такое для MP3...


50$


 
Virgo_Style ©   (2006-10-22 14:51) [16]

Ketmar ©   (22.10.06 13:11) [11]
тебе и Delphi в руки %-)


Чего доброго, и правда когда-нибудь возьмусь. Но не в ближайшее время однозначно...

@!!ex ©   (22.10.06 14:42) [15]
50$


imho ты довольно дешево просишь =) Хотя навскидку я уже не припомню, сколько стоят пакеты, обещающие такую фишку. Но я бы за такую цену вряд ли взялся.


 
Chort ©   (2006-10-22 15:03) [17]


> Чародей ©   (22.10.06 12:08)  

попробовал запустить скан на весь диск(D) - так забрало 80% памяти(нужно было брать один поток). прога хорошая, нужно подкоректировать выбор диска, директории(метод тыка, а не метод прописи)


 
Чародей ©   (2006-10-22 15:09) [18]


> Chort ©   (22.10.06 15:03) [17]
>
> > Чародей ©   (22.10.06 12:08)  
>
> попробовал запустить скан на весь диск(D) - так забрало
> 80% памяти(нужно было брать один поток). прога хорошая,
> нужно подкоректировать выбор диска, директории(метод тыка,
>  а не метод прописи)

80% какой памяти? Объем выделяемой памяти регулируется размером кеша.
>  метод тыка,  а не метод прописи
Вообще не понял


 
ANTPro ©   (2006-10-22 15:12) [19]


> [18] Чародей ©   (22.10.06 15:09)
> Вообще не понял

Выбирать, а не писать?


 
Chort ©   (2006-10-22 15:22) [20]


> 80% какой памяти? Объем выделяемой памяти регулируется размером
> кеша.


я протупил: сначала запустил скан, потом увидел про кеш

> Вообще не понял

DriveComboBox ,DirectoryListBox и в том же духе. мОжно FolderList
var
 Dir: string;
begin
 Dir:="";
 if OpenDirDialog("Select a folder to scan", Dir) and
    (FoldersList.Items.IndexOf(Dir)<0) then begin
     FoldersList.ItemIndex:=FoldersList.Items.Add(Dir);
 end;
end;


 
Чародей ©   (2006-10-22 15:33) [21]

Тьфу, блин. Я интерфейс вообще не делал, так наброски чтобы было видно результаты (там еще очень много чего не так и кнопки нажимать аккуратно и во время скана лучше ничего не трогать).
Мня интересует возможность ускорения работы. А то 1500 картинок ~ 5 часов :\(


 
ANTPro ©   (2006-10-22 15:51) [22]

> [21] Чародей ©   (22.10.06 15:33)
> Мня интересует возможность ускорения работы

Что именно тебя не устраивает?
Где теряется скорость?


 
Чародей ©   (2006-10-22 16:16) [23]

Основная потеря из-за "пузырькового метода" (т.е. каждая картинка со всеми последующими). Загрузку и сравнение более-менее ускорил по 20 мс (IJL + DIB + asm) против по 200мс стандартными средствами (jpeg + ScanLine); и еще немного выигрывается за счет кеша и двух потоков, хотя последнее дает несколько сомнительные результаты(может я не правильно использую возможности двух потоков?). возможно дадут результаты какие-либо предвыборки, сортировки? Интересно мнение тех кто сталкивался с подобными вопросами


 
ANTPro ©   (2006-10-22 16:21) [24]

> [21] Чародей ©   (22.10.06 15:33)
> 1500 картинок ~ 5 часов :\(

Теоритчески так и получается
Оптимизировать можно только алгоритм
ЗЫЖ Алгоритм в студию :)


 
@!!ex ©   (2006-10-22 16:21) [25]

Не видел кода, влом качать. смотреть... Да и некогда особо...
Но есть предложение, которое у тебя возможно не реализованно.
Два потока:
1 - Сверяет две картинки
2 - загружает следующую картинку.

Теоретически должно очень все это дело ускорить, так как задействованны разные ресурсы.

Virgo_Style ©   (22.10.06 14:51) [16]

Там же все тупо и банально.
Сверка аудио потока довольно тревиальная задача, насколько мне известно.


 
Virgo_Style ©   (2006-10-22 16:27) [26]

@!!ex ©   (22.10.06 16:21) [25]
Там же все тупо и банально.
Сверка аудио потока довольно тревиальная задача, насколько мне известно.


Не знаю, я довольно далек от предмета обсуждения, однако сомневаюсь, что причиной отсутствия таких программ является банальность и тривиальность алгоритма.


 
@!!ex ©   (2006-10-22 16:34) [27]


> Virgo_Style ©   (22.10.06 16:27) [26]

Уверен, что они отсутствуют? :))


 
Ученик чародея ©   (2006-10-22 16:37) [28]


> @!!ex ©   (22.10.06 16:21) [25]
> Virgo_Style ©   (22.10.06 14:51) [16]
>
> Там же все тупо и банально.
> Сверка аудио потока довольно тревиальная задача, насколько
> мне известно.


Угу, как и распознавание изображения и речи. Сдвиг на 1 сек и у тебя 2 разных mp3. Проверка схожести Mp3 производится по тегам в файле, как имя песни/альбома/автора...


 
@!!ex ©   (2006-10-22 16:45) [29]


> Угу, как и распознавание изображения и речи.

Давно решенные задачи.


> Сдвиг на 1 сек и у тебя 2 разных mp3

Почему??
Все это опциоанльно. И свдиг можно проверять и все остальное.


> Проверка схожести Mp3 производится по тегам в файле, как
> имя песни/альбома/автора...

Кто сказал? :))
Как хочу так и проверяю. ;)


 
Gero ©   (2006-10-22 16:47) [30]

> [29] @!!ex ©   (22.10.06 16:45)


> Давно решенные задачи.

А мужики-то не знали (c)


 
Gero ©   (2006-10-22 16:48) [31]

> [29] @!!ex ©   (22.10.06 16:45)

Ты занимался этим? У тебя есть пример, который делает подобное?


 
Gero ©   (2006-10-22 16:49) [32]

> [29] @!!ex ©   (22.10.06 16:45)

Не, насчет давно решенных задач — до сих пор смеюсь!


 
@!!ex ©   (2006-10-22 16:51) [33]


> Gero ©   (22.10.06 16:48) [31]


50$


> Gero ©   (22.10.06 16:49) [32]

Распознавание изображения используеются в современных системах наведения(Ракет в частности).

С распознаванием речи без проблем справляется Dragon всего через 2 месяца обучения.


 
Gero ©   (2006-10-22 17:06) [34]

> [33] @!!ex ©   (22.10.06 16:51)

Это означеет, что свои слова ты подтвердить не можешь?

> Распознавание изображения используеются в современных системах
> наведения(Ракет в частности).

И как далеко оно зашло? Если я покажу несколько своих фотографий или портретов — система сможет определить, что это я?

> С распознаванием речи без проблем справляется Dragon всего
> через 2 месяца обучения.

А я справляюсь с распознаванием твоей речи моменально. Так что тут насчет давно решенной проблемы?


 
Chort ©   (2006-10-22 17:06) [35]


> С распознаванием речи без проблем справляется Dragon всего
> через 2 месяца обучения.

можно поподробнее?


 
@!!ex ©   (2006-10-22 17:10) [36]


> Это означеет, что свои слова ты подтвердить не можешь?

ПОчему не могу? Могу. 50$


> И как далеко оно зашло? Если я покажу несколько своих фотографий
> или портретов — система сможет определить, что это я?

Не имею практики в данном вопросе, но смею предположить что с некторой точнотью предположит.


> А я справляюсь с распознаванием твоей речи моменально. Так
> что тут насчет давно решенной проблемы?

А типо когда ты в детстве учился говорить и понимать мы за обучение считать не будем?


> Chort ©   (22.10.06 17:06) [35]

Что конкретно?


 
Chort ©   (2006-10-22 17:17) [37]


> Что конкретно?

о программе.Что это за прога(в поиске выдает раскидалку игр, рок группу)


 
Чародей ©   (2006-10-22 17:22) [38]


> Алгоритм в студию :)

Выкладывать примерно 600 строк как-то многовато.

> Два потока:
> 1 - Сверяет две картинки
> 2 - загружает следующую картинку.

Сравнение гораздо быстрее загрузки поэтому 1 будет постоянно ждать 2.

Что-бы уменьшить влияние времени загрузки был добавлен кеш и все сравнения происходят в памяти. т.е. допустим есть 4 картинки, тогда общая схема сравнения будет выглядеть так:
1 2 3 4
 1 2 3
   1 2
     1
Сравнение происходит 1L-2L, 1-3L, 1-4L, 2L-3L, 2-4L, 3L-4L. L - означает загрузку из файла.
При использовании кеша:
Допустим в кеш уместились картинки 1 и 2, тогда схема получается:
L1,L2, 1-2, 1-3L, 2-3, 1-4L, 2-4, сброс кеша, L3, L4, 3-4
При большом размере кеша выигрыш получается существенный.
А потоки используют одну и туже процедуру, по с разными параметрами индекса в полном списке найденных файлов.


 
ANTPro ©   (2006-10-22 17:28) [39]

> [38] Чародей ©   (22.10.06 17:22)
> Выкладывать примерно 600 строк как-то многовато.

Алгоритм не код? Можно сжать и положить...


 
Gero ©   (2006-10-22 17:28) [40]

> [36] @!!ex ©   (22.10.06 17:10)

Ты мне ценник свой не суй, ляпнул, а теперь пытаешься отмазаться. Я не предлагал тебе ничего писать, а конкретно спросил, и спрашиваю еще раз: «Ты занимался этим? У тебя есть пример, который делает подобное?». Ты в состоянии ответить на этот вопрос?
Если тебе так хочется выпонить программу, я могу заплатить тебе 50$ за программу которая будет показывать процент схожеcти звучания mp3-файла при разумных сроках, но если ты с заданием не справишься, ты платишь мне 5000$. Идет?

> Не имею практики в данном вопросе

С этого и надо было начинать.

> А типо когда ты в детстве учился говорить и понимать мы
> за обучение считать не будем?

Будем. Разработчики программы, думаю, тоже на месте ине видели и усиленно ее учили.
Но стоит также считать и то, что я могу распознать любую речь, а программа — только определенную, ту, которую в нее 2 месяца вдалбливали.


 
Gero ©   (2006-10-22 17:31) [41]

> @!!ex ©

Говорить о распознавании как о решенной проблеме можно лишь тогда, когда программа в этом вопросе не будет уступать человеку.


 
guav ©   (2006-10-22 17:40) [42]

Можно сравнить с DUP Detector (сам пользовался, дубликаты ищет хорошо, скорость устраивает).


 
Чародей ©   (2006-10-22 17:40) [43]


> Алгоритм не код? Можно сжать и положить...

[38]  и есть алгоритм


 
ANTPro ©   (2006-10-22 18:11) [44]

> [43] Чародей ©   (22.10.06 17:40)
> и есть алгоритм

Нет это не алгоритм сравнения...


 
Vovan#1   (2006-10-22 18:19) [45]

>С распознаванием речи без проблем справляется Dragon всего через 2 месяца обучения.

Что за фигню несёшь. Распознавание речи до сих пор не решено.


 
DrPass ©   (2006-10-22 18:46) [46]


> Vovan#1   (22.10.06 18:19) [45]

Странно... а почему моя мобилка умеет набирать номер под диктовку? Или она не знает, что это еще невозможно?


 
Chort ©   (2006-10-22 18:54) [47]


> Что за фигню несёшь. Распознавание речи до сих пор не решено.

сейчас закачиваю "не решенную программу" - распознавалку речи -Горыныч(весит зараза 19 метров). Так вот тебе и невозможное стало возможным.


 
Ученик чародея ©   (2006-10-22 19:23) [48]


> @!!ex ©   (22.10.06 16:51) [33]
>
> Распознавание изображения используеются в современных системах
> наведения(Ракет в частности).
>
> С распознаванием речи без проблем справляется Dragon всего
> через 2 месяца обучения.


Вот ссылка.
http://www.webfile.ru/1160352

За какое время вы способны написать код, распознающий подобный текст с 95% вероятностью с учетом, что используемый язык и шрифт в тексте только один, причем без использования API программ распознавания типа FineReader или иных коммерческих программ.


 
Чародей ©   (2006-10-22 19:43) [49]


> Virgo_Style ©   (22.10.06 13:08) [10]
> C ImgSearch (c) by Vladimir Kladov сравнивал?

Так и не нашел

> guav ©   (22.10.06 17:40) [42]
> Можно сравнить с DUP Detector (сам пользовался, дубликаты
> ищет хорошо, скорость устраивает).

Он ищет только идентичные картинки, про говорилось в [12]. Не имеет смысла, слишком просто 100 строк кода, без интерфейса


 
guav ©   (2006-10-22 19:51) [50]

> [49] Чародей ©   (22.10.06 19:43)
> Он ищет только идентичные картинки, про говорилось в [12].
> Не имеет смысла, слишком просто 100 строк кода, без интерфейса

нет, он именно ищет похожие картинки. Причём даже разных форматов.


 
Чародей ©   (2006-10-22 20:55) [51]

Скачал DUP Detector. Нда все мои начинания можно выкинуть :.( Тема закрыта


 
@!!ex ©   (2006-10-22 21:01) [52]


> Gero ©   (22.10.06 17:28) [40]

Ценник я поставил еще до вашего вопроса.
И да. Я работал со звуком на этом уровне.

Я согласен сделать программу. 50$.
Две недели.
Плюс страховка 500$.
В случае невыполнения задания в срок возвращаю 5000$.


> Gero ©   (22.10.06 17:31) [41]

Программы распознавания речи обучавшиеся продолжительное время практически не уступают человеку.


> Chort ©   (22.10.06 18:54) [47]

Горыныч на базе Дракона построен.


> Ученик чародея ©   (22.10.06 19:23) [48]

Очень много времени работаю с нейросетями, доклады по ним приходится писать. Практически все не занятое учебой и девушкой время сейчас приходится тратить на написание и отладку софта прямым образом связанного с созданием, обучением и вычислением нейросетей.
Поэтому подобную "распознавалку" обучу быстро и не особо напрягаясь.
Неудачный пример вы подобрали, уважаемый. ;)

P.S.
Сувать в качестве примера текста текст об обучении нейросети, это не смешно. :))
Нехорошо так намекать на мою необразованность. ;))


 
ANTPro ©   (2006-10-22 21:08) [53]

> [52] @!!ex ©   (22.10.06 21:01)

Можешь поделиться какой-нибуть софтиной связанной с нейросетями?
Мне надо для курсовика, отмазаться...


 
@!!ex ©   (2006-10-22 21:11) [54]


> ANTPro ©   (22.10.06 21:08) [53]

Ммм. у нас комплекс софта....

Могу редактор нейросетей подкинуть. :)

Ща скрин дам.


 
ANTPro ©   (2006-10-22 21:11) [55]

Что-нибудь простенькое...


 
@!!ex ©   (2006-10-22 21:18) [56]

Редактор.
http://afera-net.narod.ru/NNE.GIF

Есть еще утилита раскидывающая задания сети всем доступным серверам, следящая за обучением и реализующая экспертную систему.


 
Vovan#1   (2006-10-22 21:25) [57]

Удалено модератором


 
@!!ex ©   (2006-10-22 21:26) [58]


> Vovan#1   (22.10.06 21:25) [57]

НЕ путайте, уважаемый.
Вы не знали, что номер можно набирать голосом?
не заранее записанный. А циферки.


 
ANTPro ©   (2006-10-22 21:27) [59]

> [56] @!!ex ©   (22.10.06 21:18)

Я так понимаю ICQ у тебя нет?
Стукни мне в ICQ когда появится ;)


 
Vovan#1   (2006-10-22 21:28) [60]

>Странно... а почему моя мобилка умеет набирать номер под диктовку? Или она не знает, что это еще невозможно?

Не, я не могу. Есть два битмапа, один с чёрной полоской, другой чисто белой. Нужно распознать, где какой. Ну задал задачу... ой не могу, вся мощь Сони Эрикссон собралась... и да! сделала такую мобилку!!! Мы порвали всех!


 
Vovan#1   (2006-10-22 21:29) [61]

>НЕ путайте, уважаемый.
Вы не знали, что номер можно набирать голосом?
не заранее записанный. А циферки.

Не путаю, неуважаемый. Ещё пять лет назад вышел Сакраменто, который в демке с этим запросто справлялся, и я всё ждал, когда ж в телефоны встроят.


 
Pavia ©   (2006-10-22 21:54) [62]

Скачал я ваш ImgSearch - чето как то медленно работает, у меня быстрее.

> Очень много времени работаю с нейросетями, доклады по ним
> приходится писать.

А что посоветуешь почитать по НС. А то как то теория вся приметивная или слишкам фармулизована.


 
Gero ©   (2006-10-22 22:08) [63]

> [52] @!!ex ©   (22.10.06 21:01)

Зачем страховка?


 
Ученик чародея ©   (2006-10-22 22:08) [64]


> @!!ex ©   (22.10.06 21:01) [52]
> > Ученик чародея ©   (22.10.06 19:23) [48]
>
> Очень много времени работаю с нейросетями, доклады по ним
> приходится писать. Практически все не занятое учебой и девушкой
> время сейчас приходится тратить на написание и отладку софта
> прямым образом связанного с созданием, обучением и вычислением
> нейросетей.
> Поэтому подобную "распознавалку" обучу быстро и не особо
> напрягаясь.
> Неудачный пример вы подобрали, уважаемый. ;)
>
> P.S.
> Сувать в качестве примера текста текст об обучении нейросети,
>  это не смешно. :))
> Нехорошо так намекать на мою необразованность. ;))


Тоесть где-то у вас можно скачать простую демку, которая сможет распознавать тексты в подобном качестве и переводить их в txt или rtf? И сколько будет стоить подобная библиотека?


 
Gero ©   (2006-10-22 22:08) [65]

> [62] Pavia ©   (22.10.06 21:54)


> А что посоветуешь почитать по НС. А то как то теория вся
> приметивная или слишкам фармулизована.

Орфографический словарь.


 
Pavia ©   (2006-10-22 22:18) [66]


> Орфографический словарь.

Да надо, но эта книга у меня в конце списка.
Сравнение файлов:
1570 фалов за  80с. +20с. на построение дерева
3150 фалов за 190с. +55с. на построение дерева


 
@!!ex ©   (2006-10-22 22:31) [67]


> Тоесть где-то у вас можно скачать простую демку, которая
> сможет распознавать тексты в подобном качестве и переводить
> их в txt или rtf? И сколько будет стоить подобная библиотека?
>


На данный момент софт не продается и продавать не планируется.
Могу лично продемонстрировать работу, примерно через 5 недель, когда будет командировка в Москву.
Собственно система нейросетей - это не одна программа, потому что вычисления(обычно существенно более сложные, чем распознавание текста) приходится разбивать на несколько серверов, плюс ЭС реализовывать.


> Gero ©   (22.10.06 22:08) [63]

5000$ не было оговоренно в начальных условиях.
Сделаю за пол года без страховки.
Выже понимаете, что в данном случае 500$ погоды не сделают в случае, если я не успею. Ну будт выигрыш не 5000, а 4500, не большая разница.
Зато окупят мне эти две недели.


> А что посоветуешь почитать по НС. А то как то теория вся
> приметивная или слишкам фармулизована.


Не знаю ваш уровень.
Уоссерман. Нейрокомпьютерная техника: Теория и практика
Довольно интересно и понятно написанная книжка, с хорошим обхватом темы, и обучение с учителем и без учителя, описание основных способов подсройки весов в частности методом обратного распространения ошибки, примеры реально работающих сетей и все такое.
В инете есть в йифровом виде.


 
Gero ©   (2006-10-22 22:39) [68]

> [67] @!!ex ©   (22.10.06 22:31)

Что-то я не могу понять, кто кого страховать должен и 500$ платить.


 
Gero ©   (2006-10-22 22:53) [69]

> [67] @!!ex ©   (22.10.06 22:31)

Ты мне вот обьясни, если распознавание образов достигло совершенства, почему нет систем позволяющих, например, искать изображения по названиям образов.
Например, ввобжу я в гугле слово: виноград и он выдает мне картинки с изображением винограда, именно распознавая их, а не читая подписи. Ведь человек делает это интуитивно и элементарно. Хочешь сказать, что наука на сегодня дошла до этого? Ой-ли.


 
ANTPro ©   (2006-10-22 23:03) [70]

> [69] Gero ©   (22.10.06 22:53)

Исскуственный интелект существует? Вот это и есть совершенство...


 
Virgo_Style ©   (2006-10-22 23:14) [71]

@!!ex ©   (22.10.06 16:34) [27]
Уверен, что они отсутствуют? :))


Я уверен, что ни одна бесплатная программа, позволяющая сравнить mp3/wav "на слух", не была найдена мной в google месяц тому назад.

Хотя делов-то, в самом простом и грубом варианте - отдать звуковой поток распознавателю речи и сравнить тексты. Элементарно ж.
Только не говорите мне, что распознаватель может работать только с чистой речью без шумов :-P


 
Zeqfreed ©   (2006-10-22 23:15) [72]


> Gero ©   (22.10.06 22:53) [69]


> Например, ввобжу я в гугле слово: виноград и он выдает мне
> картинки с изображением винограда, именно распознавая их,
>  а не читая подписи.

Кажется мне, что не окупится гуглу такой проект. Поэтому никто и не реализовывает, что на текущий момент хватает других средств. А область постепенно развивают.


 
Gero ©   (2006-10-22 23:21) [73]

> [71] Virgo_Style ©   (22.10.06 23:14)


> Хотя делов-то, в самом простом и грубом варианте - отдать
> звуковой поток распознавателю речи и сравнить тексты. Элементарно
> ж.
> Только не говорите мне, что распознаватель может работать
> только с чистой речью без шумов :-P

И какой текст он выдаст на пятую симфонию Бетховена?


 
Virgo_Style ©   (2006-10-22 23:27) [74]

Gero ©   (22.10.06 23:21) [73]
И какой текст он выдаст на пятую симфонию Бетховена?


Да, слово "грубый" употреблено мной именно в этом смысле.


 
programania ©   (2006-10-23 00:47) [75]

http://programania.com/ENJOL.ZIP   880 кб
Ищет похожие картинки, музыку, тексты, фильмы, подробнее
http://programania.com/i02_ru.htm
http://programania.com/a02_ru.htm
http://programania.com/t06_ru.htm


 
Ученик чародея ©   (2006-10-23 02:26) [76]


> @!!ex ©   (22.10.06 22:31) [67]
> На данный момент софт не продается и продавать не планируется.
>
> Могу лично продемонстрировать работу, примерно через 5 недель,
>  когда будет командировка в Москву.
> Собственно система нейросетей - это не одна программа, потому
> что вычисления(обычно существенно более сложные, чем распознавание
> текста) приходится разбивать на несколько серверов, плюс
> ЭС реализовывать.


Во первых я в Киеве. Во вторых я тоже занимался проблемой НС, ГА и адаптивных алгоритмов. Так что если вы хотите подавать туда голый растр, то толку не будет. Сперва нужно произвести векторизацию растра, а только потом уже распознавать по дельте отклонения вектора. Вот там уже можно НС.  Кроме того есть довольно серьезная проблема с выделением непрямоугольных полигонов - необходимо для векторизации растра. Если все сделать будет распознавать намного лучше FineReader но каждый алгоритм довольно сложен, а во всей совокупности работа практически невозможна для одного разработчика.


> Не знаю ваш уровень.
> Уоссерман. Нейрокомпьютерная техника: Теория и практика
> Довольно интересно и понятно написанная книжка, с хорошим
> обхватом темы, и обучение с учителем и без учителя, описание
> основных способов подсройки весов в частности методом обратного
> распространения ошибки, примеры реально работающих сетей
> и все такое.
> В инете есть в йифровом виде.


Да, у меня на домашней странице есть подборка.


 
TUser ©   (2006-10-23 05:26) [77]


> Для Delphi код можно взять здесь http://alglib.sources.ru/fft/fft.
> php но там только одномерное преобразование, а вот для C
> здесь http://www.fftw.org/

fftw - есть заголовочные файлы для Delphi


 
TUser ©   (2006-10-23 05:27) [78]

Автору - tnx. Нормальная программа, правда AV мне сказала (при клике на 0 errors read images), но картинки находит.


 
Дятел ©   (2006-10-23 09:43) [79]

>@!!ex ©   (22.10.06 21:01) [52]
>Я согласен сделать программу. 50$.
Две недели.


50 уёв за две недели? Это 0.625 американских рублей в час? Нет уж, спасибо. Лучше уж индусам отдать...

>Плюс страховка 500$.

А персональных стриптизёршу и Ламборджини не надо?

А вообще...

>@!!ex ©   (22.10.06 16:45) [29]
> Угу, как и распознавание изображения и речи.
Давно решенные задачи.


LMD.


 
Ученик чародея ©   (2006-10-23 14:58) [80]


> Дятел ©   (23.10.06 09:43) [79]
>
> >@!!ex ©   (22.10.06 21:01) [52]
> >Я согласен сделать программу. 50$.
> Две недели.
>
> 50 уёв за две недели? Это 0.625 американских рублей в час?
>  Нет уж, спасибо. Лучше уж индусам отдать...


За этот код (распознавания указанной выше картинки) я бы сразу 50$ отдал, так как FineReader5 ею подавился.



Страницы: 1 2 вся ветка

Форум: "Прочее";
Текущий архив: 2006.11.12;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.68 MB
Время: 0.048 c
15-1161744506
Slider007
2006-10-25 06:48
2006.11.12
С днем рождения ! 25 октября


15-1161983461
unknown
2006-10-28 01:11
2006.11.12
Clawfinger


15-1161573842
Slider007
2006-10-23 07:24
2006.11.12
С днем рождения ! 21 октября


15-1161790219
oldman
2006-10-25 19:30
2006.11.12
Вот и до нас дошел прогресс... :(


15-1161887041
ProgRAMmer Dimonych
2006-10-26 22:24
2006.11.12
Delphi взглючнуть решил





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский