Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.06.17;
Скачать: CL | DM;

Вниз

Сравнение текста   Найти похожие ветки 

 
_Mouse_   (2007-04-19 09:52) [0]

Добрый день мастера. Имею задачу сравнить 2 текста (~3-5 тыс. знаков) на уникальность друг от друга и вывести результат в ввиде % или неких баллов.
Пробовал легкими алгоритмами, но не получается так как в тексте могут вставлены и пропущены слова, предложения. Могут абзацы поменяться местами. Может все что угодно.
Есть у когото на примете алгоритмы или ф-ции для такого мероприятия?
Заранее спасибо.


 
Правильный Вася   (2007-04-19 11:25) [1]


> в ввиде % или неких баллов.

от этого агоритм и зависит


 
Jeer ©   (2007-04-19 12:05) [2]


> Может все что угодно



> Есть у когото на примете


Человек.


 
_Mouse_   (2007-04-19 12:24) [3]


>
> > в ввиде % или неких баллов.
>
> от этого агоритм и зависит
>

Если баллы от 1 до 100 - это и есть проценты.


> Человек.

А код?


 
Desdechado ©   (2007-04-19 12:51) [4]

> Может все что угодно.
Как тогда определить степень совпадения твоих текстов? По количеству одинаковых букв? Или CRC взять?


 
{RASkov}   (2007-04-19 13:20) [5]

> [3] _Mouse_   (19.04.07 12:24)
> А код?

Что по твоему должен вернуть твой код при сравнении таких двух текстов
Вася    |  Маша
Петя    |  Гриша
Гуля    |  Федя
Гриша   |  Вася
Федя    |  Питя
Маша    |  Галя

Некоторые ошибки не случайны.


 
_Mouse_   (2007-04-19 13:50) [6]

Спасибо, но я уже нашел 2 подходящих метода:
Кива и Левенштейн.


 
Юрий Зотов ©   (2007-04-19 17:39) [7]

Еще можно пощупать Soundex (сравнение строк по "звуковому" образу).
См. в поисковиках.


 
_Mouse_   (2007-04-19 18:20) [8]

Ок. Сенкс :-)



Страницы: 1 вся ветка

Текущий архив: 2007.06.17;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.068 c
1-1176910471
mr.sokolOFF
2007-04-18 19:34
2007.06.17
HTML-тэги


15-1179825442
vajo
2007-05-22 13:17
2007.06.17
BDS2006 - C++ Builder. Преобразование числа в строку


15-1179914699
_alex_niv_
2007-05-23 14:04
2007.06.17
алгоритм поиска строк методом cуффиксного дерева


2-1180080747
delphino
2007-05-25 12:12
2007.06.17
Можно ли объединить два фильтра


3-1175001305
DelphiLexx
2007-03-27 17:15
2007.06.17
Создание полей произвольных типов, универсальным способом