Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.01.10;
Скачать: CL | DM;

Вниз

как лучше сравнить строки   Найти похожие ветки 

 
self.name ©   (2008-07-28 21:34) [0]

Здравсвуйте.
Нужно сравнить две строки. Подскажите какие-нить алгоритмы.
Хочу получить процент сходства. Например, между "сума", "сумма", "суммой"...
Прошу прощения, если не в ту ветку написал - другой не нашёл.


 
KilkennyCat ©   (2008-07-28 21:44) [1]

сложный вопрос. Особенно, если учитывать опечатки, например: дечёнка и девчонка


 
Сергей М. ©   (2008-07-28 21:47) [2]


> процент сходства. Например, между "сума", "сумма"


Нулевой процент.
И не зарекайся)


 
KilkennyCat ©   (2008-07-28 21:48) [3]


> Сергей М. ©   (28.07.08 21:47) [2]

вот-вот. если еще и по смыслу, то точно нулевой.


 
Сергей М. ©   (2008-07-28 21:50) [4]


> self.name ©   (28.07.08 21:34)  


Тебе бы еще, любкзный, понять для начала, что ставнение строк и сравнение текстов - две разные разницы.


 
self.name ©   (2008-07-28 22:22) [5]

ценю ваше чувство юмора. но "сума" (укр.) и "сумма" (рус.) имеют все 100% сходства.

> Тебе бы еще, любкзный, понять для начала, что ставнение
> строк и сравнение текстов - две разные разницы.

буду рад узнать. где про это почитать?


 
Сергей М. ©   (2008-07-28 22:29) [6]


> где про это почитать?


Да прямо перед носом - в стандартной справке)


> "сума" (укр.) и "сумма" (рус.)


ты еще туда десяток каких-нить тыгдынских языков присовокупь - вот веселый алгоритм получится)


 
self.name ©   (2008-07-28 22:37) [7]


> Да прямо перед носом - в стандартной справке)

ага. огромное спасибо.


> ты еще туда десяток каких-нить тыгдынских языков присовокупь
> - вот веселый алгоритм получится)

при чём тут языки?
даже если просто удалить все повторяющиеся буквы, то уже можно получить как результат совпадение. а учесть количество тех самых повторений - ошибку.
я не прав?


 
Сергей М. ©   (2008-07-28 22:41) [8]


> при чём тут языки?


А в чем тогда заключается 100%-ное сходство между кацапской "суммой" и хохляцкой "сумой" ?)


 
Anatoly Podgoretsky ©   (2008-07-28 22:47) [9]

Уже обсуждали эту тему и пришли к выводу, что в слове ХЛЕБ четыре ошибки, правильно ПИВО


 
McSimm ©   (2008-07-28 23:22) [10]

Посмотрите расстояние Левенштейна, может подойдет для вашей задачи.


 
MsGuns ©   (2008-07-28 23:54) [11]

Самое интересное, что "кацапская" сума и "хохлятская" сума дадут 100% сходство. Между тем это два совершенно разных слова ;)


 
KilkennyCat ©   (2008-07-29 00:54) [12]


> MsGuns ©   (28.07.08 23:54) [11]


Не, алгоритм не позволит. Он же понимает, что если перед "сума" стоит "сало", то...


 
Anatoly Podgoretsky ©   (2008-07-29 01:01) [13]

> KilkennyCat  (29.07.2008 0:54:12)  [12]

Это табу.


 
MsGuns ©   (2008-07-29 01:04) [14]

>KilkennyCat ©   (29.07.08 00:54) [12]
>Не, алгоритм не позволит. Он же понимает, что если перед "сума" >стоит "сало", то...

Во-во, как в анекдоте про "незабаром" и "сравни" ;)


 
self.name ©   (2008-07-29 01:18) [15]


> MsGuns

в каком же месте 100%? стоило бы уделить внимание всему моему посту, а не только началу.
сало, сравни...юмор не к месту. интересно что ж в ветке Прочее творится..

> McSimm

Спасибо:) буду искать.
Приятно удивлен, что не всех пробило на хаха.


 
KilkennyCat ©   (2008-07-29 01:30) [16]

Собственно, ха-ха не было.
Я могу даже добавить, что в Делфи есть готовые функции работы со строками, оценивающие "звучание".
А чтоб не получать дурацких ответов, не стоит задавать неточных вопросов. Ибо в общем варианте, да еще с [5], для решения подобной задачи требуется либо ИИ, либо перебор громадной текстовой базы.


 
self.name ©   (2008-07-29 01:39) [17]

та и ладно.
расстояние Левенштейна мне очень подошло.
еще раз спасибо McSimm.
удачи всем


 
Vlad Oshin ©   (2008-07-29 09:12) [18]

в Кладовке есть неплохая вещь. Или не в кладовке..но я оттуда брал, кажется..


 
простой   (2008-07-29 11:22) [19]

Смотри статью "Алгоритмы нечеткого сравнения строк. Практическое применение." http://www.delphikingdom.com/asp/viewitem.asp?catalogid=1147
и статью "Функция приблизительного/нечеткого сравнения строк" http://www.delphikingdom.com/asp/viewitem.asp?catalogid=722
А также посмотри обсуждение этих статей.
Я думаю, это именно то, что тебя интересует.


 
self.name ©   (2008-07-29 18:15) [20]


простой, Vlad Oshin

спасибо, пойду почитаю:)


 
имя   (2009-01-27 02:12) [21]

Удалено модератором



Страницы: 1 вся ветка

Текущий архив: 2010.01.10;
Скачать: CL | DM;

Наверх




Память: 0.51 MB
Время: 0.013 c
2-1258701942
Андрей Смирнов
2009-11-20 10:25
2010.01.10
D2009 PChar является PWideChar, как правельно?


15-1257526923
Avant Browsr
2009-11-06 20:02
2010.01.10
Где хранятся "Избранное" и "Журнал"?


4-1226515228
АгатаКристи
2008-11-12 21:40
2010.01.10
Настройка TCP/IP


2-1258432086
ℓoℓ
2009-11-17 07:28
2010.01.10
Вопрос о переводе кода (CTL_CODE)


2-1258386947
Evgnevius
2009-11-16 18:55
2010.01.10
OpenGL не хочет рисовать на битмапе