Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2009.11.01;
Скачать: [xml.tar.bz2];

Вниз

Алгоритм получения ключевых слов в современных поисковиках   Найти похожие ветки 

 
xayam ©   (2009-09-01 17:08) [0]

Интересует автоматический способ получения ключевых слов (мета-тег keywords) по произвольному тексту. Понятно, что можно посчитать сколько раз встречается каждое слово, непонятно как из них выбрать ключевые. Сабж.


 
xayam ©   (2009-09-01 17:13) [1]

точнее наверно не "в современных поисковиках" а "для современных поисковиков"


 
Jeer ©   (2009-09-01 17:15) [2]


> непонятно как из них выбрать ключевые


День знаний ?


 
TUser ©   (2009-09-01 17:17) [3]

Ну точный алгоритм какого-нибудь гугла вряд ли кто так просто скажет. В общих чертах они могут смотреть на

1. Насколько редкое слово
2. Насколько часто встречается в данном тексте
3. В каком месте текста встречается (хорошо, если в заголовке), выделено ли как-нибудь
4. Насколько часто встречаются тексты (и/или поисковые запросы), где часто встречается такая комбинация слов. Например, слово "компьютер" может оказаться ключевым, если рядом есть также слово "программист" - такая связка встречается часто и свидетельствует о функционаьной значимости этого слова. А если слово "компьютер" встречается в тексте про помаду и ванильный сахар, то весьма вероятно это блонди-сайт с текстом типа: "Девочки, выбирать касметику и варить пирожаные - эта очинь проста, эта вам не на кампьютере работать." В таком случае это слово является не очень значимым, во всяком случае запрашиватель вряд ли нуждается в таком контенте, если пишет запрос с этим словом.
5. Смотрят в свою базу синонимов/омонимов/антонимов/жаргонизмов, ...


 
xayam ©   (2009-09-01 18:30) [4]

ну это понятно, но мне только кейвордс корректно сформировать для поисковиков или нафиг можно забить на этот тег. Слышал что раньше его спамеры использовали для повышения позиций своих сайтов, поэтому современные поисковики ориентируются на текст в основном


 
TIF ©   (2009-09-01 18:36) [5]

> Слышал что раньше его спамеры использовали для повышения
> позиций своих сайтов, поэтому современные поисковики ориентируются
> на текст в основном

Именно так. Keywords ради традиции нужен, но его могут проигнорировать

Алгоритмы выделения ключевых слов засекречены именно по этой причине "чтобы особо умные не поднимали сайт в выдаче", поэтому сабж как бы должен остаться без ответа :)

Но можно почитать официальные справки в Яндексе, Google, на Rambler и понять общий принцип поиска уникальной информации и ключевых слов, а также то, на какие теги они ориентируются и т.д.



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2009.11.01;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.005 c
2-1252691357
tima
2009-09-11 21:49
2009.11.01
покраска ячеек в гриде


6-1209058825
keymaster
2008-04-24 21:40
2009.11.01
Авторизация на FTP через AD


15-1252096207
Юрий
2009-09-05 00:30
2009.11.01
С днем рождения ! 5 сентября 2009 суббота


15-1251105928
pasha_golub
2009-08-24 13:25
2009.11.01
Unit tests. Советы требуются


2-1251457128
ArcticCat
2009-08-28 14:58
2009.11.01
Глюк с Win7





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский