Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.02.10;
Скачать: CL | DM;

Вниз

Процентная похожесть строк.   Найти похожие ветки 

 
Гость из солнечной Алматы   (2003-01-27 12:51) [0]

Требуеться function(procedure) которая могла бы сопоставить
две строки и выдать результат в процентном соотношение.

Типа

стр1 Корова
стр2 Карова

результат строки совпадают на 80%

Заранее благодарен.


 
REA ©   (2003-01-27 12:59) [1]

А корова и орки насколько? Что считать похожестью? Звучание?
Можно наверно посчитать спектры букв и сравнить как то.


 
Гость из солнечной Алматы   (2003-01-28 07:35) [2]

Ну если по большому счету, то я видел такую функцию в PHP.
И я думаю похожесть строк там основана не только на частоте
встречаемости одних и тех же букв в двух строках.
Но также зависит от порядка их следования.То есть

abc и abc 100%
abc и bca 66%

Большинство алгоритмов по-буквенного сравнения
не являються оптимальными.
На мой взгляд некий универсальный алгоритм будет включать
в себя частоту встречаемости,порядок следования и сравнение
длины двух строк.

Далее могу добавить лишь только, что алгоритм разработан
Оливером в 1993г.


 
Separator ©   (2003-01-28 07:58) [3]

Кстати в Алматы сейчас не так уж много солнца


 
Гость из солнечной Алматы   (2003-01-30 14:52) [4]

Да, в Алмате идет... вот прямо сейчас ... снег... Много снега...
Давайте не будем кидать Офтопики.Просто уважаемый Separator
я был жутко разочарован когда увидел, что моя надежда на
дельный совет с очередным сообщение не оправдалась.


Delphi код который делает анализ строки исходя из длины двух
слов,конечно, кривовато но если использовать SoundEx в Дельфях
то может быть будет более менее.

function LCS_Length(s1,s2:string):integer;
var m,n : integer;
LCS_Len_Tab : array[0..128,0..128] of integer;
i,j : integer;
begin
m:=length(s1);
n:=length(s2);
for i:=1 to m-1 do LCS_Len_Tab[i,0]:=0;
for j:=1 to n-1 do LCS_Len_Tab[0,j]:=0;

for i:=1 to m do
begin
for j:=1 to n do
begin
if (s1[i-1]=s2[j-1]) then LCS_Len_Tab[i,j]:=LCS_Len_Tab[i-1,j-1]+1
else if (LCS_Len_Tab[i-1,j]>=LCS_Len_Tab[i,j-1]) then LCS_Len_Tab[i,j]:=LCS_Len_Tab[i-1,j]
else LCS_Len_Tab[i,j]:=LCS_Len_Tab[i,j-1]+1;
end;
end;
LCS_Length:=LCS_Len_Tab[m,n];
end;

function get_lcs(s1,s2:string):real;
var lcs:integer;
ms:real;
begin
s1:=lowercase(s1);
s2:=lowercase(s2);
lcs:=LCS_Length(s1,s2);
ms:=(length(s1)+length(s2))/2;
get_lcs:=((lcs*100)/ms);
end;



Страницы: 1 вся ветка

Текущий архив: 2003.02.10;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.026 c
14-29101
Anatoly Podgoretsky
2003-01-26 02:04
2003.02.10
Именинники 26 января


1-28873
pl_quad
2003-01-30 15:26
2003.02.10
Enumerated type


4-29163
vidiv
2002-12-27 11:50
2003.02.10
ПРОГРАМЕРЫ, как в TShellListView сделать фоновый рисунок?


9-28568
Armageddon
2002-08-31 11:15
2003.02.10
Разное


14-29013
Tsr
2003-01-20 22:17
2003.02.10
Paragon NTFS for windows