Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2008.07.20;
Скачать: [xml.tar.bz2];

Вниз

Поиск в I-нете..   Найти похожие ветки 

 
AlexDan ©   (2008-06-04 11:48) [0]

Глупый вопрос. Ликбез. Как яндекс или др. может так быстро искать информацию? Там что, всё в оперативной (электронной) памяти? Ведь поиск одного файла даже на простом кампе(не говоря о его просмотре, т.е. внутреннем поиске) процесс далеко не мгновенный. На сколько же там(на поисковиках) больше информации..


 
Kerk ©   (2008-06-04 11:49) [1]

Почитай про индексы в базах данных


 
Ega23 ©   (2008-06-04 11:50) [2]


> ам что, всё в оперативной (электронной) памяти?


Не, там специальные ini-файлы такие.


 
brother ©   (2008-06-04 11:58) [3]


> Не, там специальные ini-файлы такие.

))))))) Прям таки и ini?)
ИМХО Бд там, а скорость выборки у нее приличная... ну и железо ясен пень...


 
Ega23 ©   (2008-06-04 12:04) [4]


> ))))))) Прям таки и ini?)


Конечно. У них расширение чуть-чуть другое и используется там специальный TIniFileEx из юнита IniFilesEx (секретная разработка CG для поисковых систем). Типа, он там быстрее читает и в память всё грузит.


 
Zeqfreed ©   (2008-06-04 12:06) [5]

На Google I/O, вроде, проскакивала информация, что один запрос обрабатывают от 700 до 1000 серверов.


 
tesseract ©   (2008-06-04 14:50) [6]


> Zeqfreed ©   (04.06.08 12:06) [5]


Вполне вероятно. Распределёнка  нехилая такая выходит.


 
Ega23 ©   (2008-06-04 15:03) [7]


> Вполне вероятно. Распределёнка  нехилая такая выходит.


И ini-файлы - они тоже в пространстве размазаны...


 
Anatoly Podgoretsky ©   (2008-06-04 15:11) [8]

> Zeqfreed  (04.06.2008 12:06:05)  [5]

Гугл младенец по сравнению с Яху, у тех многие сотни тысяч компьютеров, когда меня индексировали, то это очень наглядно было видно, бедный яндекс индексировал с одной машниы, в несколько потоков. Гугл уже сотни, но с одной сети, Яху множество машин с разных сетей класса А.
имена поисковых машин у них - ccdddddd
Заодно они протестировали мой сайт на нагрузку, выдерживал до 800 подключений одновременно. Оно бы было и больше, но у меня не 100мбитная сеть.


 
Юрий ©   (2008-06-04 15:15) [9]

> [8] Anatoly Podgoretsky ©   (04.06.08 15:11)
> Гугл младенец по сравнению с Яху, у тех многие сотни тысяч
> компьютеров, когда меня индексировали, то это очень наглядно
> было видно, бедный яндекс индексировал с одной машниы, в
> несколько потоков. Гугл уже сотни, но с одной сети, Яху
> множество машин с разных сетей класса А.

Во где, наверное, поработать интересно.


 
Правильный_Вася   (2008-06-04 15:23) [10]


> Во где, наверное, поработать интересно.

превратить яндекс в яху?


 
Kerk ©   (2008-06-04 15:26) [11]


> Anatoly Podgoretsky ©   (04.06.08 15:11) [8]
> > Zeqfreed  (04.06.2008 12:06:05)  [5]
>
> Гугл младенец по сравнению с Яху, у тех многие сотни тысяч
> компьютеров, когда меня индексировали, то это очень наглядно
> было видно, бедный яндекс индексировал с одной машниы, в
> несколько потоков. Гугл уже сотни, но с одной сети, Яху
> множество машин с разных сетей класса А.
> имена поисковых машин у них - ccdddddd
> Заодно они протестировали мой сайт на нагрузку, выдерживал
> до 800 подключений одновременно

DDoS практически, нафиг не нужны такие немладенцы.


 
ketmar ©   (2008-06-04 15:31) [12]

>[8] Anatoly Podgoretsky © (2008-06-04 15:11:00)
>Гугл уже сотни, но с одной сети

и знал бы ты, как я заколебался файрволом банить этих идиотских ботов!

---
All Your Base Are Belong to Us


 
Юрий ©   (2008-06-04 15:31) [13]

> [10] Правильный_Вася   (04.06.08 15:23)
> превратить яндекс в яху?

Просто поработать. :)


 
Kerk ©   (2008-06-04 16:05) [14]


> ketmar ©   (04.06.08 15:31) [12]

robots.txt настроить религия не позволяет?


 
ketmar ©   (2008-06-04 16:21) [15]

>[14] Kerk © (2008-06-04 16:05:00)
если бы оно его нормально спрашивало — это раз. мне эти запросы вообще не нужны, даже запросы robots.txt — это два. гадит в лог всяким мусором. чем раскидывать по разным местам текстовый файл, который мне мешает (и это для удобства робота, который ко мне вообще отношения не имеет, бесплатно, причём), я тупо забанил подсеть. и стало тихо да спокойно.

---
Understanding is not required. Only obedience.


 
ketmar ©   (2008-06-04 16:23) [16]

а всё потому, что идеология неверна. надо не «лазить по умолчанию, не лазить если попросят», а «лазить только если явно разрешили лазить», для чего сделать веб-морду с одним edit"ом и кнопкой «я хочу!»

любые другие действия (в частности, частое и регулярное посещение моего ресурса ботами, которых я не звал) — есть действия как минимум некорректные, караютс вечным баном.

---
All Your Base Are Belong to Us


 
Anatoly Podgoretsky ©   (2008-06-04 16:54) [17]

> Юрий  (04.06.2008 15:15:09)  [9]

Не уверен, что работать в гигантской корпорации интересно.


 
Anatoly Podgoretsky ©   (2008-06-04 16:55) [18]

> Правильный_Вася  (04.06.2008 15:23:10)  [10]

Бабок и Гугла не хватит, не то что у Яндекса.
Не зря Микрософт хотел купить именно их, они в курсе их технологий.


 
Anatoly Podgoretsky ©   (2008-06-04 16:56) [19]

> Kerk  (04.06.2008 15:26:11)  [11]

Ничего не умер, правда фильтр временами отказывался работать, говорил слишком великая скорость запросов.


 
Anatoly Podgoretsky ©   (2008-06-04 16:56) [20]

> ketmar  (04.06.2008 15:31:12)  [12]

А не пробовал robots.txt применить, выше указаные боты слушаются.


 
Anatoly Podgoretsky ©   (2008-06-04 16:57) [21]

> ketmar  (04.06.2008 16:21:15)  [15]

Будешь блокировать несколько сетей класса А, в которых не только боты?


 
Пробегал...   (2008-06-04 17:01) [22]

> хотел купить

Почему же хотел? Он и сейчас хочет. Правда, переговоры отложили на месяц-другой. Yahoo! не против сделки, ни в коем разе! Они просто сказали... что стоят больше, чем предлагает майкрософт, и согласились на сделку, но по более высокой цене. У МС пока таких денег нет :) Следующая попытка будет летом, и я уверен, что уже удачная

:) Улыбнуло, что в нете сделку уже окрестили Microhoo


 
ketmar ©   (2008-06-04 18:12) [23]

>[21] Anatoly Podgoretsky © (2008-06-04 16:57:00)
>Будешь блокировать несколько сетей класса А, в которых не только боты?

не просто «буду», а заблокировал. %-)

---
Understanding is not required. Only obedience.


 
Palladin ©   (2008-06-04 18:13) [24]

иногда, у меня возникае ощущение, что кроме кетмара никто на ресурс кетмара зайти не может )


 
ketmar ©   (2008-06-04 18:20) [25]

>[24] Palladin © (2008-06-04 18:13:00)
а оно почти так и есть. тут речь о сугубо секретном ресурсе, который в инет хоть и торчит, но никто почти о нём не знает. вопрос «какая скотина засветила ссылку» открыт, кстати. %-)

---
Understanding is not required. Only obedience.


 
Palladin ©   (2008-06-04 18:33) [26]

просто нужно знать волшебные слова для поиска :)


 
Anatoly Podgoretsky ©   (2008-06-04 19:21) [27]

> Palladin  (04.06.2008 18:13:24)  [24]

Все заблокировал :-)


 
Kerk ©   (2008-06-04 19:22) [28]


> ketmar ©   (04.06.08 18:20) [25]

Достаточно было кому-нибудь зайти с установленным Google Toolbar.


 
ketmar ©   (2008-06-04 19:38) [29]

>[28] Kerk © (2008-06-04 19:22:00)
таких посетителей точно не надо.

---
Understanding is not required. Only obedience.


 
ketmar ©   (2008-06-04 19:38) [30]

>[28] Kerk © (2008-06-04 19:22:00)
впрочем, их и не должно было быть: по идее знающие о ресурсе адекватны, мусора не ставят.

---
All Your Base Are Belong to Us


 
Правильный_Вася   (2008-06-04 20:29) [31]


> вопрос «какая скотина засветила ссылку» открыт, кстати.

ты сам ее раздавал пару лет назад


 
ketmar ©   (2008-06-04 20:44) [32]

>[31] Правильный_Вася (2008-06-04 20:29:00)
ссылку я давал одну, а робот лазит на другие. на которые с той одной ссылок нет. и списки файлов у меня не показываются, потому что lighttpd не умеет этого.

---
Understanding is not required. Only obedience.


 
VirEx ©   (2008-06-05 10:52) [33]

http://jdmc.kladovka.net.ru/log.txt


 
DrPass ©   (2008-06-05 12:36) [34]


> ketmar ©   (04.06.08 16:23) [16]


> а всё потому, что идеология неверна. надо не «лазить по
> умолчанию, не лазить если попросят», а «лазить только если
> явно разрешили лазить»

Идеология как раз верна. Спайдер поисковика заинтересован в том, чтобы собрать всю информацию, до которой он доберется, ему глубоко начхать, забанят его или нет - в конце концов, желающих быть проиндексированными намного больше, чем нежелающих. Забота же о нагрузке на сервер - это личная проблема хозяев сервера.


 
Anatoly Podgoretsky ©   (2008-06-05 13:17) [35]

> DrPass  (05.06.2008 12:36:34)  [34]

Тот который лезет, куда запрещено является сетевым вирусом, это просто атака на сайт.
Его обязаности описаны в robots.txt - те кто не подчиняется этому является зловредной программой.


 
ketmar ©   (2008-06-05 13:25) [36]

>[34] DrPass © (2008-06-05 12:36:00)
как ты думаешь, лично меня сильно волнуют интересы поисковика?

>[35] Anatoly Podgoretsky © (2008-06-05 13:17:00)
неа.
правильная логика программы: «пока мне не разрешили, я не делаю».
неправильная логика зловредной программы: «пока мне не запретили, я делаю что хочу».
надо не запрет в явно виде прописывать, а разрешение в явном виде. любая программа, которая по-умолчанию считает, что ей можно всё, что не запрещено — зловредная.

---
All Your Base Are Belong to Us


 
Anatoly Podgoretsky ©   (2008-06-05 14:31) [37]

> ketmar  (05.06.2008 13:25:36)  [36]

Я не хочу искать описание robots.txt кажется что-то там есть.


 
ketmar ©   (2008-06-05 14:34) [38]

>[37] Anatoly Podgoretsky © (2008-06-05 14:31:00)
штука в том, что я должен создать роботс.тхт чтобы запретить. а правильно будет — создать, чтобы разрешить, и потом явно указать на сайте поисковика, что вот сюда теперь ходи — тут тебе еды положили.

---
Understanding is not required. Only obedience.


 
Anatoly Podgoretsky ©   (2008-06-05 15:18) [39]

> ketmar  (05.06.2008 14:34:38)  [38]

Ну тут твои представления с разработчиками не совпадают.


 
Пробегал2....   (2008-06-05 15:20) [40]

Anatoly Podgoretsky ©   (04.06.08 15:11) [8]
бедный яндекс индексировал с одной машниы, в несколько потоков. Гугл уже сотни, но с одной сети, Яху множество машин с разных сетей класса А.


о как. Оказывается теперь яху кручу всех. Совсем недавно как-то по другому было:

>Вот еще и gogle подключился, но у этих математика получше, а Яху >работает как спамбот.

Младенцы? Просто кто-то умеет работать адекватно, а кто-то нет.

ketmar ©   (04.06.08 15:31) [12]
и знал бы ты, как я заколебался файрволом банить этих идиотских ботов!


вот же делать кому-то нечего...


 
Пробегал2....   (2008-06-05 15:22) [41]

Удалено модератором
Примечание: п.1 правил


 
ketmar ©   (2008-06-05 15:29) [42]

>[39] Anatoly Podgoretsky © (2008-06-05 15:18:00)
к сожалению.

>[41] Пробегал2…. (2008-06-05 15:22:00)
>Если сайт открыт в интернет — значит, он уже по-умолчанию считается общественным

ЩИТО?! O_O ты формулируй-то аккуратней. а то ты щаз написал, что если я сайт в инет выставил, то это значит, что кто угодно с ним может делать что угодно. в том числе и менять контент.

а что там смогут или не смогут поисковики — это проблема поисковиков, не моя. пусть заключают с хостерами соглашения, например, а хостеры с клиентами — о том, что право индексировать сайт поисковиком дано по-дефолту. мой же ресурс хостится лично мной, я никому таких прав не давал. ну, и не даю дальше — файрволом.

---
Understanding is not required. Only obedience.


 
Anatoly Podgoretsky ©   (2008-06-05 15:37) [43]

> Пробегал2....  (05.06.2008 15:20:40)  [40]

Сколько там за весь Яху предложили? А стоимость Гула и Яндекса знаешь.
У Яху очень мощная аппаратная база, старые они.


 
DrPass ©   (2008-06-05 15:37) [44]


> ketmar ©   (05.06.08 13:25) [36]
> >[34] DrPass © (2008-06-05 12:36:00)
> как ты думаешь, лично меня сильно волнуют интересы поисковика?
>

Нет. Но голова за твой сайт должна болеть только у тебя, а не у кого-либо еще в Интернете, так что не жалуйся :)


 
Правильный_Вася   (2008-06-05 15:41) [45]


> ketmar ©

увы, это принцип частной собственности
хочешь, чтоб не взяли, цепляй замок, ставь забор или хотя бы вывеску
иначе никто не знает, что оно твое


 
ketmar ©   (2008-06-05 15:45) [46]

>[45] Правильный_Вася (2008-06-05 15:41:00)
вот за эти принципы и надо убивать. «не твоё» по умолчанию всё, что ты не сделал и что тебе не подарили/продали. к сожалению, подобное в черепа не вбивается, и потому анархия невозможна…

---
All Your Base Are Belong to Us


 
ketmar ©   (2008-06-05 15:46) [47]

>[44] DrPass © (2008-06-05 15:37:00)
а я никого и не заставляю за меня сайт админить.

---
Understanding is not required. Only obedience.


 
Павел Калугин ©   (2008-06-05 15:46) [48]


> Anatoly Podgoretsky ©   (05.06.08 15:18) [39]
> Ну тут твои представления с разработчиками не совпадают.
>

и с пользователями поисковика тоже...


> ketmar ©   (05.06.08 15:29) [42]

А вот мне всегда казалось что если сайт выставлен в тырнет от чобы его прочел любой желающий, то есть любая программа умеющая "читать сайты".
Следовательно по умолчанию читать можно всем и вся. а дальще укручивание доступа уже делается.


 
ketmar ©   (2008-06-05 15:48) [49]

>[48] Павел Калугин © (2008-06-05 15:46:00)
ты посмотри выше. про «любой желающий» речи не шло, и ссылок на публичных ресурсах, по которым мог приползти бот, не было. однако ж приполз, зарза. а я его ни разу не звал. и никого не звал вообще. просто не ставил тотальный забор (уже поставил %-).

---
All Your Base Are Belong to Us


 
Anatoly Podgoretsky ©   (2008-06-05 16:07) [50]

> ketmar  (05.06.2008 15:45:46)  [46]

Это паблик домейн, иначе ты должен явно запретить вход, техническими средствами, как минимум пароль.


 
Anatoly Podgoretsky ©   (2008-06-05 16:08) [51]

> ketmar  (05.06.2008 15:48:49)  [49]

Представь как ты поисковика заспамишь если поставишь пароль и будешь им выдавать код ошибки 200


 
ketmar ©   (2008-06-05 16:22) [52]

>[50] Anatoly Podgoretsky © (2008-06-05 16:07:00)
>Это паблик домейн

ни разу. там написано: «ботам и с ботами нельзя». я виноват, что их тупые боты читать не умеют?

>[51] Anatoly Podgoretsky © (2008-06-05 16:08:00)
ну да. уроню гугль, тут вообще ужас начнётся. и так куча народу считают, что здесь филиал, а так весь рунет ломанётся.

---
All Your Base Are Belong to Us


 
Пробегал2....   (2008-06-05 16:27) [53]

ketmar ©   (05.06.08 15:29) [42]
ЩИТО?! O_O ты формулируй-то аккуратней. а то ты щаз написал, что если я сайт в инет выставил, то это значит, что кто угодно с ним может делать что угодно. в том числе и менять контент.


я все правильно сформулировал. Если хочешь точнее - общественным достоянием. Это все равно что поставить памятник в центре города и удивляться, какого хрена на него все глазеют. Но это не значит, что с этим памятником каждый может делать что угодно.

Если ты выходишь на улицу - у людей есть полное право смотреть на тебя. Если тебе не нравится - не выходи на улицу. Но разрешения посмотреть на тебя никто спрашивать не должен.

Точно также сам факт выкладывания сайта в ОБЩЕДОСТУПНУЮ сеть является согласием с тем, что с этим сайтом могут соединяться другие компьютеры. Ты ЗНАЛ, что твоим сайтом могут заинтересоваться поисковые шпионы. Но тем не менее ты ВЫЛОЖИЛ сайт. На что жалуемся?

Скажи спасибо, что поисковые роботы вообще обращают внимание на robots.txt, они этого абсолютно не должны делать.


 
Пробегал2....   (2008-06-05 16:28) [54]

ketmar ©   (05.06.08 16:22) [52]
ни разу. там написано: «ботам и с ботами нельзя». я виноват, что их тупые боты читать не умеют?


они виноваты, что ты не умеешь объяснить ботам, что сюда не надо?


 
ketmar ©   (2008-06-05 16:31) [55]

>[54] Пробегал2…. (2008-06-05 16:28:00)
лни виноваты, что их боты не понимают лицензий. или получается, что если на меня валят DDoS (к примеру), то я виноват в том, что не пояснил ддос-ботам, что меня ддосить не надо?

алсо, памятник не является «общественным достоянием», обычно они в ведении муниципалитета. твой пример крив. если бы он являлся «общественным достоянием», я бы мог отпилить ему какой-нибудь интересный орган. советую тебе на досуге попробовать, узнаешь много интересного. в частности тебе популярно пояснят, что никакого «общественного достояния» там и рядом не лежало.

---
All Your Base Are Belong to Us


 
Anatoly Podgoretsky ©   (2008-06-05 16:36) [56]

> ketmar  (05.06.2008 16:22:52)  [52]

Прими как должное, а в качестве разлечения поборись с ними.
Насчет уроню, я уронил все поисковые системы, когда запустил новый сайт, все ссылки стали вести в никуда, вот тогда они как звери набросились на новый сайты, первые дни только одни боты его и читали.


 
guav ©   (2008-06-05 16:39) [57]

Боты вроде юзер агент пишут, честно признаются что они не люди.


 
ketmar ©   (2008-06-05 16:40) [58]

>[56] Anatoly Podgoretsky © (2008-06-05 16:36:00)
а чего там бороться? гуглонет забанил, остальных мне известных отсеиваю по юзерагенту. дальше проверки строки http-сервером они не пролазят, и в ответ получают страницу «пошёл ты на …, пятачок».

---
All Your Base Are Belong to Us


 
ketmar ©   (2008-06-05 16:40) [59]

>[57] guav © (2008-06-05 16:39:00)
ога. только нигде нет списка всех «нелюдей», чтобы я регэксп скопипастил. %-)

---
All Your Base Are Belong to Us


 
Anatoly Podgoretsky ©   (2008-06-05 16:46) [60]

> Пробегал2....  (05.06.2008 16:28:54)  [54]

Ламер он!


 
Anatoly Podgoretsky ©   (2008-06-05 16:46) [61]

> Пробегал2....  (05.06.2008 16:28:54)  [54]

Как там насчет ответа о стоимости?


 
guav ©   (2008-06-05 16:48) [62]

> [59] ketmar ©   (05.06.08 16:40)

Можно завести список известных людей + список известных нелюдей + у остальных явно спрашивать и заносить в списки по результатам ответов :)


 
Anatoly Podgoretsky ©   (2008-06-05 17:03) [63]

> guav  (05.06.2008 16:39:57)  [57]

Не все, есть звери


 
Пробегал2....   (2008-06-05 17:08) [64]

Удалено модератором
Примечание: п.1 правил


 
ketmar ©   (2008-06-05 17:08) [65]

>[62] guav © (2008-06-05 16:48:00)
а вдруг бот кем прикинится?

---
Understanding is not required. Only obedience.


 
ketmar ©   (2008-06-05 17:08) [66]

>[65] ketmar © (2008-06-05 17:08:00)
тьфу. встроеный в мозг спеллчекер глюкнул.

---
All Your Base Are Belong to Us


 
Пробегал2....   (2008-06-05 17:08) [67]

Anatoly Podgoretsky ©   (05.06.08 16:46) [61]
Как там насчет ответа о стоимости?


я должен на что-то отвечать? ;)


 
Style ©   (2008-06-05 17:16) [68]


> Гугл младенец по сравнению с Яху, у тех многие сотни тысяч
> компьютеров, когда меня индексировали, то это очень наглядно
> было видно, бедный яндекс индексировал с одной машниы, в
> несколько потоков. Гугл уже сотни, но с одной сети, Яху
> множество машин с разных сетей класса А.
> имена поисковых машин у них - ccdddddd
> Заодно они протестировали мой сайт на нагрузку, выдерживал
> до 800 подключений одновременно. Оно бы было и больше, но
> у меня не 100мбитная сеть.


угу а  я потом голову ломаю откуда у меня на форуме 300 посетителей одновременно было )


 
Anatoly Podgoretsky ©   (2008-06-05 19:19) [69]

> Пробегал2....  (05.06.2008 17:08:07)  [67]

Не должен, но если захочешь, то я разрешение даю.


 
Anatoly Podgoretsky ©   (2008-06-05 19:20) [70]

> Style  (05.06.2008 17:16:08)  [68]

Если бот зацепился, то уж проиндексирует все что возможно и возможно сотнями потоков, для некоторых это будет похоже на ДДОС атаку.


 
ketmar ©   (2008-06-05 20:01) [71]

>[70] Anatoly Podgoretsky © (2008-06-05 19:20:00)
ну, гугль ещё приличный, у меня один-два потока всего было.

---
Understanding is not required. Only obedience.


 
blackman   (2008-06-05 20:40) [72]

Вообще-то эти яхи редко на русские сайты ходят. Придут и исчезают :-)
Да можно и запретить. Зачем нам Яху ? Ссылок от него не дождкшься потом. Ищут-то с ним англоязычные...
А вот Google гораздо полезнее. Лучше чем Yandex раз в 5.


 
Anatoly Podgoretsky ©   (2008-06-05 21:27) [73]

> ketmar  (05.06.2008 20:01:11)  [71]

Приличный подтверждаю, делает запрос не более чем с 10 разных ИП, про количество потоков сказать не могу, это же надо инструмент писать, могу судить только о запросах с разных ИП, а вот Яху может сделать и 100 и 200 запросов с разных ИП и из разных сетей. Ну у меня сервер мощный, но я могу представить тех у кого слабенький как сервер, так и канал. Настоящий ДДОС, все станет колом. А если сайт большой, то на много дней.


 
Anatoly Podgoretsky ©   (2008-06-05 21:30) [74]

> blackman  (05.06.2008 20:40:12)  [72]

Ну не знаю насчет ссылок, но только Яху и LiveSearch работаю адекватно, остальные или не находят или дают устаревшие, уже не действующие ссылки.
Насчет Гугла тоже не согласен дает много ссылок, большинство которых являются мусором, очень не релевантны и найти в том, мусоре что он выдал, нужное очень сложно.
Гугл это же хороший маркетинг и аггресивное продвижение. Видимо сказывается влияние родины одного из отцов основателей.


 
blackman ©   (2008-06-05 21:55) [75]

Яху и LiveSearch работаю адекватно
Может быть и адекватно для ангийского языка, но если сайт с русским, то заходов от них при поиске ждать не следует.
Англичане пользующиеся ими ищут английские слова как это ни страннно :)
Стало быть для нас пригодны только Google и Yandex которыми пользутся русскоязычные.
Хочу также заметить, что Google очень хорошо находит правильные ссылки в отличие от Yandex, который например путает новости с настоящим текстом.
Мусор в Google конечно есть, но в последнее время его гораздо меньше чем в Yandex.
Видимо сказывается влияние родины одного из отцов основателей
Это точно. У меня вообще такое впечатление, Yandex умирает, а Google постоянно совершенствуется и растет. Скоро станет национальным поисковиком судя по количеству запросов от него из России


 
Anatoly Podgoretsky ©   (2008-06-05 22:02) [76]

> blackman  (05.06.2008 21:55:15)  [75]

Есть различия и конечно в этом плане Гугл лучше, понятно почему.
Но яху на месте не стояла, а гугл полез во все дыры.
Я некоторые запросы проверяю на разных поисковиках, благо в ИЕ7 это просто и пока лучшие результаты у LiveSearch
Естественно на мой взгляд.


 
ketmar ©   (2008-06-05 22:10) [77]

>[76] Anatoly Podgoretsky © (2008-06-05 22:02:00)
>в ИЕ7 это просто

>лучшие результаты у LiveSearch
нет ли тут взаимосвязи?
%-)

---
All Your Base Are Belong to Us


 
blackman ©   (2008-06-05 22:14) [78]

пока лучшие результаты у LiveSearch
Может быть по качеству и хорошие, но объем индексации очень маленький. Очень мало страниц индексирует. Заходи редко. Хорош только для статических сайтов, редко изменяющихся. И придется долго ждать пока он соизволит...  Раз в 100 отстает от Google

Нет. Лучше Google пока нет. Кроме того у него не плохая своя статистика. Удобно использовать его поиск на сайте и т.п.


 
Пробегал2....   (2008-06-05 22:17) [79]

Anatoly Podgoretsky ©   (05.06.08 21:27) [73]
Ну у меня сервер мощный


какой же он мощный, если в своей ветке про сервер вы жаловались, что поисковые боты вешают сайт, странички с десятого раза открывались.

blackman ©   (05.06.08 21:55) [75]
от Yandex, который например путает новости с настоящим текстом


ух ты. А что есть "НАСТОЯЩИЙ ТЕКСТ"?


 
blackman ©   (2008-06-05 22:22) [80]

Зашел, пробегал... Ух ты... :)))


 
Anatoly Podgoretsky ©   (2008-06-05 22:22) [81]

> ketmar  (05.06.2008 22:10:17)  [77]

Не знаю, с Гугл понятно есть взаимосвящь, а остальными не знаю, но я попробовал поиск по разным словоформам. Так яху нашел не только словоформы, но и формы на английском языке, на странице нет русского варианта, я искал по своей фамилии.
И Яху и Лайв дали мало мусора, им попугаи не нужны. А от Гугла толку было мало, выдал кучу, но не нужного. При определенных запросах и Яху и Лайв выдали строго по одной ссылке, поскольку аргументом поиска была конкретная страница, Гугл опять же вывалил несколько тысяч. Но не выдал нужног и спрашивается и нафига они меня несколько дней терроризировали, как Гугл, так и Яндекс? Но они известны своей попсовостью.
Но все это не страшно, поскольку поисковик у меня настроен и переключение мгновенно в два клика, без необходимости повторного ввода.
Но тебе то это неизвестно, ты же Кетмар

К сожалению одним или двумя поисковиками не обойтись, некоторые запросы может выполнять один, другие другой.


 
Anatoly Podgoretsky ©   (2008-06-05 22:35) [82]

> blackman  (05.06.2008 22:14:18)  [78]

Меня не обошел вниманием, и я понять не могу, откуда они узнали, что я сайт сменил, притом меня туда и обратно несколько раз, и висел несколько дней, а они как волки сидели в засаде, стоило только включить, как сразу набросились.
Насчет объема наверно так, но это не волнует, если я не получаю нужного ответа так, то быстренько просматриваю следующие, но с Гугла как правило сразу выхожу, только предварительно плюнув.


 
Anatoly Podgoretsky ©   (2008-06-05 22:38) [83]

> Пробегал2....  (05.06.2008 22:17:19)  [79]

Это я жаловался не на ботов, а на неверную настройку серверов, после того как я обнаружил и сменил, с публикации на открытие портов, то ситуация сразу нормализовалась, времени на поиск много не потребовалось. А после того как сменил SBS на Standard так вообще красота стала.
Ты пытаешься меня укусить, но кусаешь не там.


 
Anatoly Podgoretsky ©   (2008-06-05 22:40) [84]

> blackman  (05.06.2008 22:22:20)  [80]

Не зашел, а мимо пробегал, увидел знакомые лица, поздоровался.


 
blackman ©   (2008-06-05 22:42) [85]

Гугла как правило сразу выхожу, только предварительно плюнув.
Это странно. У меня все наоборот. Может быть сам запрос не совсем верен?
К Гуглу надо привыкать и экспериментировать.
Ну например, если я ищу что-то связанное с delphi, то в начале запроса я пишу delphi, а уж потом фразу. Если этого не сделать, то вывалится куча ненужного. Есть и другие примочки. Надо пробовать чаще и все получится !


 
blackman ©   (2008-06-05 22:47) [86]

увидел знакомые лица, поздоровался
Узнаю я эти "некоторые лица" :)


 
Пробегал2....   (2008-06-05 23:08) [87]

Anatoly Podgoretsky ©   (05.06.08 22:22) [81]
поскольку аргументом поиска была конкретная страница


да, да! Обычно так и ищут в интернете!


 
Anatoly Podgoretsky ©   (2008-06-06 00:07) [88]

> blackman  (05.06.2008 22:42:25)  [85]

Насчет наоборот, так это же вкусы и чего о них спорить.


 
Anatoly Podgoretsky ©   (2008-06-06 00:08) [89]

> Пробегал2....  (05.06.2008 23:08:27)  [87]

Давай, давай.
Кстати тебе про логику напомнить, у тебя проблемы так и остались.


 
Пробегал2....   (2008-06-06 01:00) [90]

Anatoly Podgoretsky ©   (06.06.08 0:08) [89]
у тебя проблемы так и остались


а вы я смотрю мои проблемы лучше меня знаете ;) Когда состоялось вручение дипломов телепатов то а? ;)


 
Anatoly Podgoretsky ©   (2008-06-06 09:03) [91]

> Пробегал2....  (06.06.2008 1:00:30)  [90]

Нефиг было светиться, а у меня все ходы записаны.


 
ketmar ©   (2008-06-06 12:13) [92]

>[81] Anatoly Podgoretsky © (2008-06-05 22:22:00)
я очень-очень редко ищу что-то русское. а с английским гуголь справляется лучше всех пока. видимо, мы по разному запросы составляем. я таки пытаюсь поисковику помочь (потому что это в итоге моё время экономит), а не надеяться, что там libthelepathy уже привинтили.

---
All Your Base Are Belong to Us


 
Anatoly Podgoretsky ©   (2008-06-06 14:12) [93]

> ketmar  (06.06.2008 12:13:32)  [92]

Я тоже стараю, иногда неизвестно что пробовать, но тогда методом проб и ошибок
А касательно проверок, так это и была целенаправленая проверка, кто понимает словоформы, а кто нет.
Несколько лет назад Яху бы опозорилась.



Страницы: 1 2 3 вся ветка

Форум: "Прочее";
Текущий архив: 2008.07.20;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.71 MB
Время: 0.043 c
2-1214065057
Tom
2008-06-21 20:17
2008.07.20
Имя пользователя


15-1212582144
123-ий
2008-06-04 16:22
2008.07.20
Skype


2-1213697997
Beluy
2008-06-17 14:19
2008.07.20
Quick Report For Delphi


1-1195638277
sia
2007-11-21 12:44
2008.07.20
применение свойства Anchors


2-1213887146
Res
2008-06-19 18:52
2008.07.20
файл и потоки





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский