Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2009.11.01;
Скачать: [xml.tar.bz2];

Вниз

Алгоритм получения ключевых слов в современных поисковиках   Найти похожие ветки 

 
xayam ©   (2009-09-01 17:08) [0]

Интересует автоматический способ получения ключевых слов (мета-тег keywords) по произвольному тексту. Понятно, что можно посчитать сколько раз встречается каждое слово, непонятно как из них выбрать ключевые. Сабж.


 
xayam ©   (2009-09-01 17:13) [1]

точнее наверно не "в современных поисковиках" а "для современных поисковиков"


 
Jeer ©   (2009-09-01 17:15) [2]


> непонятно как из них выбрать ключевые


День знаний ?


 
TUser ©   (2009-09-01 17:17) [3]

Ну точный алгоритм какого-нибудь гугла вряд ли кто так просто скажет. В общих чертах они могут смотреть на

1. Насколько редкое слово
2. Насколько часто встречается в данном тексте
3. В каком месте текста встречается (хорошо, если в заголовке), выделено ли как-нибудь
4. Насколько часто встречаются тексты (и/или поисковые запросы), где часто встречается такая комбинация слов. Например, слово "компьютер" может оказаться ключевым, если рядом есть также слово "программист" - такая связка встречается часто и свидетельствует о функционаьной значимости этого слова. А если слово "компьютер" встречается в тексте про помаду и ванильный сахар, то весьма вероятно это блонди-сайт с текстом типа: "Девочки, выбирать касметику и варить пирожаные - эта очинь проста, эта вам не на кампьютере работать." В таком случае это слово является не очень значимым, во всяком случае запрашиватель вряд ли нуждается в таком контенте, если пишет запрос с этим словом.
5. Смотрят в свою базу синонимов/омонимов/антонимов/жаргонизмов, ...


 
xayam ©   (2009-09-01 18:30) [4]

ну это понятно, но мне только кейвордс корректно сформировать для поисковиков или нафиг можно забить на этот тег. Слышал что раньше его спамеры использовали для повышения позиций своих сайтов, поэтому современные поисковики ориентируются на текст в основном


 
TIF ©   (2009-09-01 18:36) [5]

> Слышал что раньше его спамеры использовали для повышения
> позиций своих сайтов, поэтому современные поисковики ориентируются
> на текст в основном

Именно так. Keywords ради традиции нужен, но его могут проигнорировать

Алгоритмы выделения ключевых слов засекречены именно по этой причине "чтобы особо умные не поднимали сайт в выдаче", поэтому сабж как бы должен остаться без ответа :)

Но можно почитать официальные справки в Яндексе, Google, на Rambler и понять общий принцип поиска уникальной информации и ключевых слов, а также то, на какие теги они ориентируются и т.д.



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2009.11.01;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.005 c
2-1252381073
TOR
2009-09-08 07:37
2009.11.01
Создается нерабочий компонент


15-1251828018
AlexDan
2009-09-01 22:00
2009.11.01
почему только один буфер обмена..?


2-1252341586
fics)
2009-09-07 20:39
2009.11.01
Вопрос по копмонентам


2-1249031312
Nel
2009-07-31 13:08
2009.11.01
Многострочная надпись и иконка на кнопке


2-1252333617
Rembo
2009-09-07 18:26
2009.11.01
Многопоточный Indy (idHTTP)





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский