Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.11.01;
Скачать: CL | DM;

Вниз

Алгоритм получения ключевых слов в современных поисковиках   Найти похожие ветки 

 
xayam ©   (2009-09-01 17:08) [0]

Интересует автоматический способ получения ключевых слов (мета-тег keywords) по произвольному тексту. Понятно, что можно посчитать сколько раз встречается каждое слово, непонятно как из них выбрать ключевые. Сабж.


 
xayam ©   (2009-09-01 17:13) [1]

точнее наверно не "в современных поисковиках" а "для современных поисковиков"


 
Jeer ©   (2009-09-01 17:15) [2]


> непонятно как из них выбрать ключевые


День знаний ?


 
TUser ©   (2009-09-01 17:17) [3]

Ну точный алгоритм какого-нибудь гугла вряд ли кто так просто скажет. В общих чертах они могут смотреть на

1. Насколько редкое слово
2. Насколько часто встречается в данном тексте
3. В каком месте текста встречается (хорошо, если в заголовке), выделено ли как-нибудь
4. Насколько часто встречаются тексты (и/или поисковые запросы), где часто встречается такая комбинация слов. Например, слово "компьютер" может оказаться ключевым, если рядом есть также слово "программист" - такая связка встречается часто и свидетельствует о функционаьной значимости этого слова. А если слово "компьютер" встречается в тексте про помаду и ванильный сахар, то весьма вероятно это блонди-сайт с текстом типа: "Девочки, выбирать касметику и варить пирожаные - эта очинь проста, эта вам не на кампьютере работать." В таком случае это слово является не очень значимым, во всяком случае запрашиватель вряд ли нуждается в таком контенте, если пишет запрос с этим словом.
5. Смотрят в свою базу синонимов/омонимов/антонимов/жаргонизмов, ...


 
xayam ©   (2009-09-01 18:30) [4]

ну это понятно, но мне только кейвордс корректно сформировать для поисковиков или нафиг можно забить на этот тег. Слышал что раньше его спамеры использовали для повышения позиций своих сайтов, поэтому современные поисковики ориентируются на текст в основном


 
TIF ©   (2009-09-01 18:36) [5]

> Слышал что раньше его спамеры использовали для повышения
> позиций своих сайтов, поэтому современные поисковики ориентируются
> на текст в основном

Именно так. Keywords ради традиции нужен, но его могут проигнорировать

Алгоритмы выделения ключевых слов засекречены именно по этой причине "чтобы особо умные не поднимали сайт в выдаче", поэтому сабж как бы должен остаться без ответа :)

Но можно почитать официальные справки в Яндексе, Google, на Rambler и понять общий принцип поиска уникальной информации и ключевых слов, а также то, на какие теги они ориентируются и т.д.



Страницы: 1 вся ветка

Текущий архив: 2009.11.01;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.01 c
11-1207200531
Дмитрий Пырин
2008-04-03 09:28
2009.11.01
Подскажите грамотный способ загрузить данные из файла в ListBox


6-1209387329
pavel_guzhanov
2008-04-28 16:55
2009.11.01
Адрес приложения, написанного с использованием IntraWeb


2-1252921892
dmitry83-nv
2009-09-14 13:51
2009.11.01
2 поля данных в ListBox


1-1222137558
Vitaliy_____
2008-09-23 06:39
2009.11.01
Установка приоритета процесса


15-1252159778
Ruzzz
2009-09-05 18:09
2009.11.01
Turbo Delphi не хочет компилировать .rc