Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2010.01.10;
Скачать: [xml.tar.bz2];

Вниз

как лучше сравнить строки   Найти похожие ветки 

 
self.name ©   (2008-07-28 21:34) [0]

Здравсвуйте.
Нужно сравнить две строки. Подскажите какие-нить алгоритмы.
Хочу получить процент сходства. Например, между "сума", "сумма", "суммой"...
Прошу прощения, если не в ту ветку написал - другой не нашёл.


 
KilkennyCat ©   (2008-07-28 21:44) [1]

сложный вопрос. Особенно, если учитывать опечатки, например: дечёнка и девчонка


 
Сергей М. ©   (2008-07-28 21:47) [2]


> процент сходства. Например, между "сума", "сумма"


Нулевой процент.
И не зарекайся)


 
KilkennyCat ©   (2008-07-28 21:48) [3]


> Сергей М. ©   (28.07.08 21:47) [2]

вот-вот. если еще и по смыслу, то точно нулевой.


 
Сергей М. ©   (2008-07-28 21:50) [4]


> self.name ©   (28.07.08 21:34)  


Тебе бы еще, любкзный, понять для начала, что ставнение строк и сравнение текстов - две разные разницы.


 
self.name ©   (2008-07-28 22:22) [5]

ценю ваше чувство юмора. но "сума" (укр.) и "сумма" (рус.) имеют все 100% сходства.

> Тебе бы еще, любкзный, понять для начала, что ставнение
> строк и сравнение текстов - две разные разницы.

буду рад узнать. где про это почитать?


 
Сергей М. ©   (2008-07-28 22:29) [6]


> где про это почитать?


Да прямо перед носом - в стандартной справке)


> "сума" (укр.) и "сумма" (рус.)


ты еще туда десяток каких-нить тыгдынских языков присовокупь - вот веселый алгоритм получится)


 
self.name ©   (2008-07-28 22:37) [7]


> Да прямо перед носом - в стандартной справке)

ага. огромное спасибо.


> ты еще туда десяток каких-нить тыгдынских языков присовокупь
> - вот веселый алгоритм получится)

при чём тут языки?
даже если просто удалить все повторяющиеся буквы, то уже можно получить как результат совпадение. а учесть количество тех самых повторений - ошибку.
я не прав?


 
Сергей М. ©   (2008-07-28 22:41) [8]


> при чём тут языки?


А в чем тогда заключается 100%-ное сходство между кацапской "суммой" и хохляцкой "сумой" ?)


 
Anatoly Podgoretsky ©   (2008-07-28 22:47) [9]

Уже обсуждали эту тему и пришли к выводу, что в слове ХЛЕБ четыре ошибки, правильно ПИВО


 
McSimm ©   (2008-07-28 23:22) [10]

Посмотрите расстояние Левенштейна, может подойдет для вашей задачи.


 
MsGuns ©   (2008-07-28 23:54) [11]

Самое интересное, что "кацапская" сума и "хохлятская" сума дадут 100% сходство. Между тем это два совершенно разных слова ;)


 
KilkennyCat ©   (2008-07-29 00:54) [12]


> MsGuns ©   (28.07.08 23:54) [11]


Не, алгоритм не позволит. Он же понимает, что если перед "сума" стоит "сало", то...


 
Anatoly Podgoretsky ©   (2008-07-29 01:01) [13]

> KilkennyCat  (29.07.2008 0:54:12)  [12]

Это табу.


 
MsGuns ©   (2008-07-29 01:04) [14]

>KilkennyCat ©   (29.07.08 00:54) [12]
>Не, алгоритм не позволит. Он же понимает, что если перед "сума" >стоит "сало", то...

Во-во, как в анекдоте про "незабаром" и "сравни" ;)


 
self.name ©   (2008-07-29 01:18) [15]


> MsGuns

в каком же месте 100%? стоило бы уделить внимание всему моему посту, а не только началу.
сало, сравни...юмор не к месту. интересно что ж в ветке Прочее творится..

> McSimm

Спасибо:) буду искать.
Приятно удивлен, что не всех пробило на хаха.


 
KilkennyCat ©   (2008-07-29 01:30) [16]

Собственно, ха-ха не было.
Я могу даже добавить, что в Делфи есть готовые функции работы со строками, оценивающие "звучание".
А чтоб не получать дурацких ответов, не стоит задавать неточных вопросов. Ибо в общем варианте, да еще с [5], для решения подобной задачи требуется либо ИИ, либо перебор громадной текстовой базы.


 
self.name ©   (2008-07-29 01:39) [17]

та и ладно.
расстояние Левенштейна мне очень подошло.
еще раз спасибо McSimm.
удачи всем


 
Vlad Oshin ©   (2008-07-29 09:12) [18]

в Кладовке есть неплохая вещь. Или не в кладовке..но я оттуда брал, кажется..


 
простой   (2008-07-29 11:22) [19]

Смотри статью "Алгоритмы нечеткого сравнения строк. Практическое применение." http://www.delphikingdom.com/asp/viewitem.asp?catalogid=1147
и статью "Функция приблизительного/нечеткого сравнения строк" http://www.delphikingdom.com/asp/viewitem.asp?catalogid=722
А также посмотри обсуждение этих статей.
Я думаю, это именно то, что тебя интересует.


 
self.name ©   (2008-07-29 18:15) [20]


простой, Vlad Oshin

спасибо, пойду почитаю:)


 
имя   (2009-01-27 02:12) [21]

Удалено модератором



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2010.01.10;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.49 MB
Время: 0.005 c
2-1258371670
noname123
2009-11-16 14:41
2010.01.10
Службы Windows


15-1257707340
SergP
2009-11-08 22:09
2010.01.10
Реклама. Яндекс Директ и пр...


4-1226515228
АгатаКристи
2008-11-12 21:40
2010.01.10
Настройка TCP/IP


15-1257580209
Игорь
2009-11-07 10:50
2010.01.10
Красный Мастер


2-1258546185
Никита7
2009-11-18 15:09
2010.01.10
Как использовать Zlib в своей программе?





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский