Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2008.03.23;
Скачать: [xml.tar.bz2];

Вниз

Список замен   Найти похожие ветки 

 
kiber-pilot ©   (2008-02-09 20:42) [0]

Есть словарь известных слов, есть слово с очепяткой. Как лучше, и быстрее подобрать слово из словаря, которым можно заменить неправильное слово. Опечатка может заключаться в том, что пропущена, добавленя или неправильна написано какая-нибудь буква.


 
Игорь Шевченко ©   (2008-02-09 20:44) [1]

Если в слове ХЛЕБ сделать четыре ошибки, получится ПИВО


 
Zeqfreed ©   (2008-02-09 20:45) [2]

http://www.norvig.com/spell-correct.html


 
Игорь Шевченко ©   (2008-02-09 21:03) [3]

Zeqfreed ©   (09.02.08 20:45) [2]

Тогда уж так:

http://gmdidro.googlepages.com/Ru_HowtoWriteaSpellingCorrector.html

Спасибо, интересная статья


 
Zeqfreed ©   (2008-02-09 21:16) [4]

> Игорь Шевченко ©   (09.02.08 21:03) [3]

Ну, кому-то в оригинале приятней читать.
Пожалуйста :)


 
TUser ©   (2008-02-09 21:32) [5]

См. про алгоритм Shift-And. Его можно модифицировать под твою задачу. Описано, например, в книге Гасфилда "Название забыл, но что-то про анализ биологических последовательностей". В принципе есть алгоритмы типа Левенталя для такого рода дел, но если речь идет о коротких последовательностях (словах), то Shift-And-подобные должны выигрывать по скорости.


 
Правильный_Вася   (2008-02-09 21:51) [6]

а опечатка в однобуквенном предлоге этими алгоритмами берется?


 
TUser ©   (2008-02-09 21:58) [7]

легко

алгоритм выдает некое число, которое характеризует "похожесть" слов

такую функцию можно определить рядом способов

но всегда - будет число

далее мы смоьтрим на порог. если число больше/меньше порога - го гуд. или не гуд.

выбирай требуемый порог - и будет опознавание ошибок в предлогах


 
Dmitry S ©   (2008-02-09 22:14) [8]


> алгоритм выдает некое число, которое характеризует "похожесть"
> слов

Так легко и выдает?



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2008.03.23;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.005 c
2-1204008737
Рома....
2008-02-26 09:52
2008.03.23
Потоки


2-1203513538
..::KraN::..
2008-02-20 16:18
2008.03.23
Вставка картинки в Synedit


3-1193751735
thely
2007-10-30 16:42
2008.03.23
Изменение БД?


2-1203495233
Dymok
2008-02-20 11:13
2008.03.23
Как обратиться к объекту на другой форме в нестандартном случае?


4-1185433986
Dmitry_177
2007-07-26 11:13
2008.03.23
Можно ли какнибудь определить время и период срабатывания таймера





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский