Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2008.04.06;
Скачать: [xml.tar.bz2];

Вниз

Алгоритм и методы поиска изображения в поисковых системах   Найти похожие ветки 

 
No_Dead ©   (2008-02-20 17:15) [0]

Собственно вот такой сабж%>
Может кто подскажет литературу или статьи?


 
tesseract ©   (2008-02-20 17:31) [1]

Я думаю эти алгоритмы слегка приносят деньги авторам и поэтому не факт что найдёшь.


 
@!!ex ©   (2008-02-20 17:39) [2]

Классификация изображения не очень сложная задача.
Во-первых ищем только среди Jpg И png, gif и остальную муру отбрасываем.
Во-вторых в первую очередь выводим те изображения, названия которых содержат/явялются текстом запроса.
Далее идет изображения, сопутствующий текст которых содержит максимальное количество соответствий запросу.
Ну и конечно обрабатываем теги, указывающии на картинки и содержащии текст запроса.
Это в кратце.
В реальности посложнее будет, но насколько мне известно, все основано на подобных предположениях.


 
Zeqfreed ©   (2008-02-20 17:44) [3]

А еще есть google image labeler :)


 
TUser ©   (2008-02-20 18:22) [4]

А что, есть поисковые системы, где можно искать по картинкам? Сцылки, plz.

По алгоритмам - хеш-функции, наверное, это позволяет быстро находить точное совпадение.


 
@!!ex ©   (2008-02-20 18:24) [5]

> [4] TUser ©   (20.02.08 18:22)

images.google.ru?


 
Проскользнул мимо...   (2008-02-20 18:27) [6]

Так что тут слжного? Сканируем содержимое html и ищем <img src="...">, в параметре alt (если он есть) смотрим комментарий к картинке, анализируем содержимое страницы для связи с картинкой и заносим в базу.

Следующий этап - сканирование фоновых рисунков 8)


 
No_Dead ©   (2008-02-20 21:45) [7]

> [2] @!!ex ©   (20.02.08 17:39)

частично так:)
нашел вот
elar.usu.ru/bitstream/1234.56789/1386/1/IMAT_2007_06.pdf

вполне достаточно будет.


 
homm ©   (2008-02-20 21:52) [8]

> [2] @!!ex ©   (20.02.08 17:39)
> Во-вторых в первую очередь выводим те изображения, названия
> которых содержат/явялются текстом запроса.

Одна беда — у картинок, как и у процессов нету имен. Про процессы вспомнил, потому что часто в начинающих бывают темы, «как по имени процесса…» а никак.

У картинки есть alt на нее может быть ссылка, у этой ссылки может быть текст и тайтл. Может еще учитыватся текст +/- 512 байт от тега с картинкой.


> [4] TUser ©   (20.02.08 18:22)
> А что, есть поисковые системы, где можно искать по картинкам?

Нет, есть много поисковый чичтем, позволяющих искать картинки (не по картинке).



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2008.04.06;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.007 c
2-1205330172
nub
2008-03-12 16:56
2008.04.06
Ошибка с ValueListEditor


15-1203873940
Поп Гапон
2008-02-24 20:25
2008.04.06
Фальшивый диплом можно распознать


2-1205403106
031178
2008-03-13 13:11
2008.04.06
Календарик в Delphi


15-1203604952
dolmat
2008-02-21 17:42
2008.04.06
Preport


15-1203686127
kaif
2008-02-22 16:15
2008.04.06
Погода





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский