Форум: "Основная";
Текущий архив: 2010.01.10;
Скачать: [xml.tar.bz2];
Внизкак лучше сравнить строки Найти похожие ветки
← →
self.name © (2008-07-28 21:34) [0]Здравсвуйте.
Нужно сравнить две строки. Подскажите какие-нить алгоритмы.
Хочу получить процент сходства. Например, между "сума", "сумма", "суммой"...
Прошу прощения, если не в ту ветку написал - другой не нашёл.
← →
KilkennyCat © (2008-07-28 21:44) [1]сложный вопрос. Особенно, если учитывать опечатки, например: дечёнка и девчонка
← →
Сергей М. © (2008-07-28 21:47) [2]
> процент сходства. Например, между "сума", "сумма"
Нулевой процент.
И не зарекайся)
← →
KilkennyCat © (2008-07-28 21:48) [3]
> Сергей М. © (28.07.08 21:47) [2]
вот-вот. если еще и по смыслу, то точно нулевой.
← →
Сергей М. © (2008-07-28 21:50) [4]
> self.name © (28.07.08 21:34)
Тебе бы еще, любкзный, понять для начала, что ставнение строк и сравнение текстов - две разные разницы.
← →
self.name © (2008-07-28 22:22) [5]ценю ваше чувство юмора. но "сума" (укр.) и "сумма" (рус.) имеют все 100% сходства.
> Тебе бы еще, любкзный, понять для начала, что ставнение
> строк и сравнение текстов - две разные разницы.
буду рад узнать. где про это почитать?
← →
Сергей М. © (2008-07-28 22:29) [6]
> где про это почитать?
Да прямо перед носом - в стандартной справке)
> "сума" (укр.) и "сумма" (рус.)
ты еще туда десяток каких-нить тыгдынских языков присовокупь - вот веселый алгоритм получится)
← →
self.name © (2008-07-28 22:37) [7]
> Да прямо перед носом - в стандартной справке)
ага. огромное спасибо.
> ты еще туда десяток каких-нить тыгдынских языков присовокупь
> - вот веселый алгоритм получится)
при чём тут языки?
даже если просто удалить все повторяющиеся буквы, то уже можно получить как результат совпадение. а учесть количество тех самых повторений - ошибку.
я не прав?
← →
Сергей М. © (2008-07-28 22:41) [8]
> при чём тут языки?
А в чем тогда заключается 100%-ное сходство между кацапской "суммой" и хохляцкой "сумой" ?)
← →
Anatoly Podgoretsky © (2008-07-28 22:47) [9]Уже обсуждали эту тему и пришли к выводу, что в слове ХЛЕБ четыре ошибки, правильно ПИВО
← →
McSimm © (2008-07-28 23:22) [10]Посмотрите расстояние Левенштейна, может подойдет для вашей задачи.
← →
MsGuns © (2008-07-28 23:54) [11]Самое интересное, что "кацапская" сума и "хохлятская" сума дадут 100% сходство. Между тем это два совершенно разных слова ;)
← →
KilkennyCat © (2008-07-29 00:54) [12]
> MsGuns © (28.07.08 23:54) [11]
Не, алгоритм не позволит. Он же понимает, что если перед "сума" стоит "сало", то...
← →
Anatoly Podgoretsky © (2008-07-29 01:01) [13]> KilkennyCat (29.07.2008 0:54:12) [12]
Это табу.
← →
MsGuns © (2008-07-29 01:04) [14]>KilkennyCat © (29.07.08 00:54) [12]
>Не, алгоритм не позволит. Он же понимает, что если перед "сума" >стоит "сало", то...
Во-во, как в анекдоте про "незабаром" и "сравни" ;)
← →
self.name © (2008-07-29 01:18) [15]
> MsGuns
в каком же месте 100%? стоило бы уделить внимание всему моему посту, а не только началу.
сало, сравни...юмор не к месту. интересно что ж в ветке Прочее творится..
> McSimm
Спасибо:) буду искать.
Приятно удивлен, что не всех пробило на хаха.
← →
KilkennyCat © (2008-07-29 01:30) [16]Собственно, ха-ха не было.
Я могу даже добавить, что в Делфи есть готовые функции работы со строками, оценивающие "звучание".
А чтоб не получать дурацких ответов, не стоит задавать неточных вопросов. Ибо в общем варианте, да еще с [5], для решения подобной задачи требуется либо ИИ, либо перебор громадной текстовой базы.
← →
self.name © (2008-07-29 01:39) [17]та и ладно.
расстояние Левенштейна мне очень подошло.
еще раз спасибо McSimm.
удачи всем
← →
Vlad Oshin © (2008-07-29 09:12) [18]в Кладовке есть неплохая вещь. Или не в кладовке..но я оттуда брал, кажется..
← →
простой (2008-07-29 11:22) [19]Смотри статью "Алгоритмы нечеткого сравнения строк. Практическое применение." http://www.delphikingdom.com/asp/viewitem.asp?catalogid=1147
и статью "Функция приблизительного/нечеткого сравнения строк" http://www.delphikingdom.com/asp/viewitem.asp?catalogid=722
А также посмотри обсуждение этих статей.
Я думаю, это именно то, что тебя интересует.
← →
self.name © (2008-07-29 18:15) [20]
простой, Vlad Oshin
спасибо, пойду почитаю:)
← →
имя (2009-01-27 02:12) [21]Удалено модератором
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2010.01.10;
Скачать: [xml.tar.bz2];
Память: 0.49 MB
Время: 0.005 c