Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2009.11.08;
Скачать: CL | DM;

Вниз

Словоформы   Найти похожие ветки 

 
картман ©   (2009-09-07 17:49) [0]

Всем доброго дня!
Подскажите, плиз, литературу по составлению поисковика с поиском по словоформам. Интересует, как генерируются словоформы.


 
TIF ©   (2009-09-07 18:50) [1]

> по составлению поисковика с поиском по словоформам

Зачем, когда есть готовые решения?
http://company.yandex.ru/technology/server/
http://company.yandex.ru/technology/mystem/

(там же см. "A fast morphological algorithm with unknown word guessing induced by a dictionary for a web search engine")

А вообще сабж - это серьёзная тема и требует глубокого изучения. Конкретной литературой тут не обойдёшься, начинать надо с учебников для русксого языка

Кстати, непонятно какой язык подразумевается? Русский? Английский? Вообще любой?


 
Кайл   (2009-09-08 11:05) [2]

А нафиг это нужно вообще? Что это дает?


 
картман ©   (2009-09-08 12:32) [3]


> TIF ©   (07.09.09 18:50) [1]

с русского и начал:)


 
картман ©   (2009-09-08 13:14) [4]


> Кайл   (08.09.09 11:05) [2]

Вообще, нужно классифицировать тексты. Думаю сделать это на основе частоты встречающихся слов - байесовский классификатор. Словарь - первый шажок


 
AlexDan ©   (2009-09-08 13:22) [5]

да, если лингвистика, то это к TIF-у:))


 
Kerk ©   (2009-09-08 13:47) [6]

На http://aot.ru/ сходи. У них неплохие морфологические словари.
Английский я перевел в базу firebird - http://tinyurl.com/m2wu89, до русского руки не доходили.


 
картман ©   (2009-09-08 14:11) [7]


> Kerk ©   (08.09.09 13:47) [6]

Спасибо, погляжу


 
картман ©   (2009-09-08 18:26) [8]


> Kerk ©   (08.09.09 13:47) [6]

а как ты словари переводил в БД?


 
Kerk ©   (2009-09-08 18:40) [9]

Софтинку написал (давно утеряна, сразу скажу). А описание формата там есть вроде бы, врядли бы я вслепую разобрался :)



Страницы: 1 вся ветка

Текущий архив: 2009.11.08;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.015 c
2-1253805878
sid
2009-09-24 19:24
2009.11.08
Массивы


3-1229344497
kyn66
2008-12-15 15:34
2009.11.08
Непонятная работа БД


2-1253858285
Johnnnn
2009-09-25 09:58
2009.11.08
IWebBrowser2 из webbrowser1.document.frames.item(i)


11-1207718048
YuriyM
2008-04-09 09:14
2009.11.08
Выравнивание текста в TKolEditBox


2-1253800991
N/O
2009-09-24 18:03
2009.11.08
вопрос по TClientDataSet