Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.08.21;
Скачать: CL | DM;

Вниз

Поиск   Найти похожие ветки 

 
Cerberus ©   (2005-08-01 00:12) [0]

По какому принципу работаю поисковики на сайтах. Если обьём который надо обработать очень велик?


 
Джо ©   (2005-08-01 00:17) [1]


> Если обьём который надо обработать очень велик?

Тогда поисковик пишет: "Не могу обработать ваш запрос. Попробуйте позже". Это если поисковик хороший. Если нет: error in search.php <lh@19u!@kh1kj > msql connect error.@!#!#!@#!@#

:^)


 
Cerberus ©   (2005-08-01 00:24) [2]

Нет просто. Хочу написать поисковик который будет искать на разных сайтах. И думаю что периберать все сайты в момент поиска слишком долго. А хранить всю информацию на своём сервере слишком большой обьём.


 
Джо ©   (2005-08-01 00:34) [3]


>  [2] Cerberus ©   (01.08.05 00:24)
> Нет просто. Хочу написать поисковик который будет искать
> на разных сайтах. И думаю что периберать все сайты в момент
> поиска слишком долго. А хранить всю информацию на своём
> сервере слишком большой обьём.

Ну так тут - или шашечки, или ехать. По секрету скажу: что поисковики ищут по уже готовой базе у себя на серверах. А базу пополняет, так называемый web-spider.


 
DrPass ©   (2005-08-01 00:34) [4]

Да ерунда. В 1997 году поисковик Alta Vista обходился 16 двухпроцессорными Alpha-серверами. А сейчас все намного проще - купил восьмипроцессорный Оптерон с дисковым массивом на десяток терабайт, поставил себе под стол, обеспечил парой выходов в сеть на несколько мегабит каждый, через разных провайдеров. И будет тебе поисковик



Страницы: 1 вся ветка

Текущий архив: 2005.08.21;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.032 c
3-1121244552
Fishka
2005-07-13 12:49
2005.08.21
DBGrid,ADODataSet и таблица с полями по умолчанию


1-1123037753
iskatel
2005-08-03 06:55
2005.08.21
proxy


1-1122644308
Destroyer
2005-07-29 17:38
2005.08.21
Как из статического массива сделать динамический?


8-1113269569
Медиамэн
2005-04-12 05:32
2005.08.21
Распарсить флэш-файл (swf)


14-1122582892
Narik
2005-07-29 00:34
2005.08.21
TWebBrowser