Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2005.07.18;
Скачать: [xml.tar.bz2];

Вниз

Оргазнизация поиска по сайту   Найти похожие ветки 

 
Kerk ©   (2005-06-24 18:36) [0]

В общем задумал я делать поиск по сайту. Весь контент лежит в базе MySQL.
Ну вот допустим есть у нас набор: keyword1, keyword2, ..., keywordN

Самое очевидное - сделать запрос:
SELECT * FROM fffff WHERE cccccc LIKE "%keyword1%" OR comment LIKE "%keyword2%"... comment LIKE "%keywordN%"

Но в таком варианте ни о какой релевантности поиска и речи быть не может.
Хотелось бы чтоб рекорды с содержанием бОльшего количества keyword[] оказывались выше.
Пока по этому поводу идей в голове нету.

Потому и задаю знаменитый вопрос - что делать?

Реклама - http://kladovka.net.ru

P.S. А может поставить для поиска по сайту формочку от Яндекса и не мучаться? Хотя все-таки хочется сделать своё.


 
Eraser ©   (2005-06-24 18:44) [1]

Kerk ©   (24.06.05 18:36)
А может поставить для поиска по сайту формочку от Яндекса и не мучаться?


На королевстве делфи так и сделали, хотя там ещё есть и поиск по "круглому столу"... самописный.

ЗЫ не мешало бы и этому ( http://www.delphimaster.ru/ ) сайту сделать хотя бы формочку от яндекса... всё лучше чем никак.


 
Ломброзо ©   (2005-06-24 19:02) [2]

Eraser ©   (24.06.05 18:44)
Kerk ©   (24.06.05 18:36)
А может поставить для поиска по сайту формочку от Яндекса и не мучаться?

На королевстве делфи так и сделали, хотя там ещё есть и поиск по "круглому столу"... самописный.

ЗЫ не мешало бы и этому ( http://www.delphimaster.ru/ ) сайту сделать хотя бы формочку от яндекса... всё лучше чем никак.


Не знаю, что есть под Perl, но вот под Java, к примеру, существуют индексирующие движки. Ото вот lucene (искать на http://jakarta.apache.org) - движок  с анализатором русского текста, ищет по релевантности без учёта словоформы. Ему на вход подаётся поток или строка, он её переваривает и кладёт в индексный файл своего формата. Наверняка существуют подобные аналоги и для Perl/PHP.

---------
DMJS 0.5 | http://dmjsclient.narod.ru


 
Ломброзо ©   (2005-06-24 19:11) [3]

М-дя. Существует порт Lucene под Perl

http://search.cpan.org/dist/Plucene/
http://use.perl.org/article.pl?sid=04/02/03/0234231

Фигня в том, что класс RussanAnalyzer в перл не портирован.


 
Kerk ©   (2005-06-24 21:44) [4]

Eraser ©   (24.06.05 18:44) [1]
не мешало бы и этому ( http://www.delphimaster.ru/ ) сайту сделать хотя бы формочку от яндекса...


Здесь не прокатит. Форум очень живой, а Яндекс ищет только среди проиндексированных страниц.

А для Кладовки все-таки хотелось бы сделать пусть простой движок, но свой, т.е. готовые движки не интересно :(. За ссылки спасибо, посмотрю.

P.S. Надо в Perl. PHP не устраивает совсем.



Страницы: 1 вся ветка

Форум: "Потрепаться";
Текущий архив: 2005.07.18;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.089 c
1-1119795223
heady
2005-06-26 18:13
2005.07.18
окно поверх ВСЕХ остальных


4-1116942710
Aleksandr.
2005-05-24 17:51
2005.07.18
Будет ли работать PostMessage из dll?


1-1119908714
Контр
2005-06-28 01:45
2005.07.18
TPageControl - как спрятать у него все заголовки ?


1-1120025152
rooker
2005-06-29 10:05
2005.07.18
главное окно программы


6-1112885724
msgipss
2005-04-07 18:55
2005.07.18
Можно ли узнать кто открыл файл на сетевом диске





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский