Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.02.10;
Скачать: CL | DM;

Вниз

Процентная похожесть строк.   Найти похожие ветки 

 
Гость из солнечной Алматы   (2003-01-27 12:51) [0]

Требуеться function(procedure) которая могла бы сопоставить
две строки и выдать результат в процентном соотношение.

Типа

стр1 Корова
стр2 Карова

результат строки совпадают на 80%

Заранее благодарен.


 
REA ©   (2003-01-27 12:59) [1]

А корова и орки насколько? Что считать похожестью? Звучание?
Можно наверно посчитать спектры букв и сравнить как то.


 
Гость из солнечной Алматы   (2003-01-28 07:35) [2]

Ну если по большому счету, то я видел такую функцию в PHP.
И я думаю похожесть строк там основана не только на частоте
встречаемости одних и тех же букв в двух строках.
Но также зависит от порядка их следования.То есть

abc и abc 100%
abc и bca 66%

Большинство алгоритмов по-буквенного сравнения
не являються оптимальными.
На мой взгляд некий универсальный алгоритм будет включать
в себя частоту встречаемости,порядок следования и сравнение
длины двух строк.

Далее могу добавить лишь только, что алгоритм разработан
Оливером в 1993г.


 
Separator ©   (2003-01-28 07:58) [3]

Кстати в Алматы сейчас не так уж много солнца


 
Гость из солнечной Алматы   (2003-01-30 14:52) [4]

Да, в Алмате идет... вот прямо сейчас ... снег... Много снега...
Давайте не будем кидать Офтопики.Просто уважаемый Separator
я был жутко разочарован когда увидел, что моя надежда на
дельный совет с очередным сообщение не оправдалась.


Delphi код который делает анализ строки исходя из длины двух
слов,конечно, кривовато но если использовать SoundEx в Дельфях
то может быть будет более менее.

function LCS_Length(s1,s2:string):integer;
var m,n : integer;
LCS_Len_Tab : array[0..128,0..128] of integer;
i,j : integer;
begin
m:=length(s1);
n:=length(s2);
for i:=1 to m-1 do LCS_Len_Tab[i,0]:=0;
for j:=1 to n-1 do LCS_Len_Tab[0,j]:=0;

for i:=1 to m do
begin
for j:=1 to n do
begin
if (s1[i-1]=s2[j-1]) then LCS_Len_Tab[i,j]:=LCS_Len_Tab[i-1,j-1]+1
else if (LCS_Len_Tab[i-1,j]>=LCS_Len_Tab[i,j-1]) then LCS_Len_Tab[i,j]:=LCS_Len_Tab[i-1,j]
else LCS_Len_Tab[i,j]:=LCS_Len_Tab[i,j-1]+1;
end;
end;
LCS_Length:=LCS_Len_Tab[m,n];
end;

function get_lcs(s1,s2:string):real;
var lcs:integer;
ms:real;
begin
s1:=lowercase(s1);
s2:=lowercase(s2);
lcs:=LCS_Length(s1,s2);
ms:=(length(s1)+length(s2))/2;
get_lcs:=((lcs*100)/ms);
end;



Страницы: 1 вся ветка

Текущий архив: 2003.02.10;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.022 c
3-28682
TUZ_SS
2003-01-24 15:04
2003.02.10
Набор дробных чисел на цифровой клавиатуре


1-28920
SergeN
2003-01-29 10:45
2003.02.10
Компоненты


1-28854
Grizl
2003-01-30 12:03
2003.02.10
Запутался в указателях.. =(


6-28970
Scorpion [BC]
2002-12-18 19:45
2003.02.10
Как через локальную сеть общаться по микрофону?


1-28829
Son!K
2003-02-02 18:49
2003.02.10
Hex в Делфи