Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2004.07.25;
Скачать: [xml.tar.bz2];

Вниз

Можно ли программно, точно определить корень слова ?   Найти похожие ветки 

 
Алекс А   (2004-07-11 05:33) [0]

Нашёл интересный код для определения корней слов :
http://www.delphiworld.narod.ru/base/root_of_word.html

Решил проверить его на примерах, и обнаружил массу ошибок.
Например в слове "вагон" , корень оказывается "агон", а "в" - приставка. В слове "баю-бай", корень "баю-б", а "ай" - окончание. И тому подобное.

А есть ли ещё какие нибудь интересные морфологические алгоритмы на Дельфи ? Желательно менее корявые. И возможно ли вообще руководствуюясь только правилами делать нормальный морфологический разбор слов и предложений ?


 
TUser ©   (2004-07-11 08:39) [1]

Задача почти нереальная. Если сделаешь - сразу садись диссер писать по лингвистике. А delphiworld - хорошая подборка, но туда попадает все, что автор нашел, часто без критического отбора. Там бывают откровенные ошибки. Даже чисто Турбо-Паскалевские коды есть, толко спереди приписано procedure Button1Click(). Так что к советам с этого сайта, особенно нетривиальным, надо относится осторожно, несмотря на наличие там большого кол-ва полезной инфы.


 
Алекс А   (2004-07-12 01:44) [2]


> TUser ©   (11.07.04 08:39) [1]
> Задача почти нереальная. Если сделаешь - сразу садись диссер
> писать по лингвистике.

Запрограммировать то, что-либо не проблема. Проблема как раз понять, что именно программировать.
Если бы была чёткая формулировка, что есть приставка, а что нет, то можно было бы запрограммировать. Или если бы была формулировка, что есть корень, или словарь корней. ...

В общем ищу лингвистические алгоритмы. Посоветуй, если знаешь какие-нибудь ? Можно не только на Дельфи. Тема интересная просто.


 
KilkennyCat ©   (2004-07-12 02:09) [3]


> Алекс А   (12.07.04 01:44) [2]


Советую искать не алгоритмы, а орфографический словарь.


 
GanibalLector ©   (2004-07-12 02:33) [4]

>Советую искать не алгоритмы, а орфографический словарь.
Согласен :)


 
KilkennyCat ©   (2004-07-12 02:58) [5]


> Алекс А   (12.07.04 01:44) [2]


По поводу "Запрограммировать то, что-либо не проблема. Проблема как раз понять, что именно программировать."
Напишите мне алгоритм следующей задачи:

Есть текст, произвольный, нам о нем ничего неизвестно, кроме одного: в нем часто используется слово "крокодил", причем часто склоняется по падежам.
Требуется определить со 100% гарантией, где это слово используется как:
1) упоминание о животном
2) прозвище
3) ругательство
4) в сравнении каких либо параметров того, что имеется ввиду в данном случае под "крокодилом", с параметрами другого объекта.

в принципе достаточно.
Напишите - поговорю с шефом чтоб взял Вас на работу алгоритмистом. Думаю, лишнии деньги Вам не помешают :)

Кстати, как интерпретируется это здесь?:

На одной из планет солнечной системы, на берегу реки сидели два существа.
- Ну ты и крокодил, - сказало одно существо другому.
- Конечно, я ведь - крокодил, - ответило то.


У меня есть несколько предположений:
1) Это были два крокодила.
2) Одного прозвали "Крокодилом", и ему это нравилось
3) Первое существо обругало второе, но второй - непонял, потому что его прозвище было "крокодил", или он на самом деле был крокодил, а первое существо об этом не знало.
4) Это были два робота марок "Страус" и "Крокодил"
..................


 
Алекс А   (2004-07-12 06:15) [6]


> GanibalLector ©   (12.07.04 02:33) [4]
> >Советую искать не алгоритмы, а орфографический словарь.
> Согласен :)


Вот тебе словари http://slovari.gramota.ru/
Ну, покажи теперь, как ты по ним корень будешь определять.


 
GrayFace ©   (2004-07-12 06:19) [7]

Вагон можно обрабатывать корректно, т.к. приставка "с" перед гласными никогда(ИМХО) не идет. Но, например, приставку "с" от части корня отличить невозможно.


 
ЮЮ ©   (2004-07-12 06:43) [8]

>Вот тебе словари http://slovari.gramota.ru/
>Ну, покажи теперь, как ты по ним корень будешь определять.

Теперь зайди по ссылке в
Морфемные и словообразовательные словари
http://slovari.gramota.ru/sl_tales.html?sl_id=223

и в конце
Пример словарной статьи

вот когда данные в твоем словаре будут представлены подобным образом, тогда и сможешь разобрать слово правильно, иначе - невозможно


 
Алекс А   (2004-07-12 07:15) [9]


> GrayFace ©   (12.07.04 06:19) [7]
> Вагон можно обрабатывать корректно, т.к. приставка "с" перед
> гласными никогда(ИМХО) не идет. Но, например, приставку
> "с" от части корня отличить невозможно.

Cыграть, безысходность.

Интересно, а лингвисты то пытались вывести общие правила, хотя бы по приставкам ? Или они сами ни черта не знают ?

Какой корень у слова "скакун" ? Функция пишет, что "с" - приставка.


 
KSergey ©   (2004-07-12 09:26) [10]

> [9] Алекс А   (12.07.04 07:15)

По-моему, четких вот именно алгоритмизированных, формальзованных правил нет. Все вообще часто сводится к поиску аналогов, которые, по-моему, вообще не алгоритмизируемы.
Отчасти над этим работают, но это, наверняка, либо невозможно впринципе, либо слишком сложно.


 
ЮЮ ©   (2004-07-12 09:28) [11]

>Какой корень у слова "скакун" ? Функция пишет, что "с" - приставка.

А корень - автор функции :)



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2004.07.25;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.48 MB
Время: 0.032 c
1-1089125866
DDDeN
2004-07-06 18:57
2004.07.25
TrackBar как в регуляторе громкости


1-1089727436
SergBlack
2004-07-13 18:03
2004.07.25
динамическое создание TQChart в Quickrep


14-1089129012
Aplay
2004-07-06 19:50
2004.07.25
Еду в Москву. Подскажите


3-1088626960
zokzok
2004-07-01 00:22
2004.07.25
Убывающий индекс


14-1088762912
ArMellon
2004-07-02 14:08
2004.07.25
Нужен русификатор 3ds max 5.1 кто знает киньте





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский