Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2008.03.23;
Скачать: [xml.tar.bz2];

Вниз

Список замен   Найти похожие ветки 

 
kiber-pilot ©   (2008-02-09 20:42) [0]

Есть словарь известных слов, есть слово с очепяткой. Как лучше, и быстрее подобрать слово из словаря, которым можно заменить неправильное слово. Опечатка может заключаться в том, что пропущена, добавленя или неправильна написано какая-нибудь буква.


 
Игорь Шевченко ©   (2008-02-09 20:44) [1]

Если в слове ХЛЕБ сделать четыре ошибки, получится ПИВО


 
Zeqfreed ©   (2008-02-09 20:45) [2]

http://www.norvig.com/spell-correct.html


 
Игорь Шевченко ©   (2008-02-09 21:03) [3]

Zeqfreed ©   (09.02.08 20:45) [2]

Тогда уж так:

http://gmdidro.googlepages.com/Ru_HowtoWriteaSpellingCorrector.html

Спасибо, интересная статья


 
Zeqfreed ©   (2008-02-09 21:16) [4]

> Игорь Шевченко ©   (09.02.08 21:03) [3]

Ну, кому-то в оригинале приятней читать.
Пожалуйста :)


 
TUser ©   (2008-02-09 21:32) [5]

См. про алгоритм Shift-And. Его можно модифицировать под твою задачу. Описано, например, в книге Гасфилда "Название забыл, но что-то про анализ биологических последовательностей". В принципе есть алгоритмы типа Левенталя для такого рода дел, но если речь идет о коротких последовательностях (словах), то Shift-And-подобные должны выигрывать по скорости.


 
Правильный_Вася   (2008-02-09 21:51) [6]

а опечатка в однобуквенном предлоге этими алгоритмами берется?


 
TUser ©   (2008-02-09 21:58) [7]

легко

алгоритм выдает некое число, которое характеризует "похожесть" слов

такую функцию можно определить рядом способов

но всегда - будет число

далее мы смоьтрим на порог. если число больше/меньше порога - го гуд. или не гуд.

выбирай требуемый порог - и будет опознавание ошибок в предлогах


 
Dmitry S ©   (2008-02-09 22:14) [8]


> алгоритм выдает некое число, которое характеризует "похожесть"
> слов

Так легко и выдает?



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2008.03.23;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.45 MB
Время: 0.006 c
2-1203425951
Alexander
2008-02-19 15:59
2008.03.23
WORD


15-1202751088
Human
2008-02-11 20:31
2008.03.23
Микрофон с наушниками для Skype


2-1203691244
San1
2008-02-22 17:40
2008.03.23
наследование свойства OnMouseMove


15-1202835000
БарЛог
2008-02-12 19:50
2008.03.23
А почему


2-1204030372
vegarulez
2008-02-26 15:52
2008.03.23
Вопрос про создание TLabel.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский