Форум: "Основная";
Текущий архив: 2007.06.17;
Скачать: [xml.tar.bz2];
ВнизСравнение текста Найти похожие ветки
← →
_Mouse_ (2007-04-19 09:52) [0]Добрый день мастера. Имею задачу сравнить 2 текста (~3-5 тыс. знаков) на уникальность друг от друга и вывести результат в ввиде % или неких баллов.
Пробовал легкими алгоритмами, но не получается так как в тексте могут вставлены и пропущены слова, предложения. Могут абзацы поменяться местами. Может все что угодно.
Есть у когото на примете алгоритмы или ф-ции для такого мероприятия?
Заранее спасибо.
← →
Правильный Вася (2007-04-19 11:25) [1]
> в ввиде % или неких баллов.
от этого агоритм и зависит
← →
Jeer © (2007-04-19 12:05) [2]
> Может все что угодно
> Есть у когото на примете
Человек.
← →
_Mouse_ (2007-04-19 12:24) [3]
>
> > в ввиде % или неких баллов.
>
> от этого агоритм и зависит
>
Если баллы от 1 до 100 - это и есть проценты.
> Человек.
А код?
← →
Desdechado © (2007-04-19 12:51) [4]> Может все что угодно.
Как тогда определить степень совпадения твоих текстов? По количеству одинаковых букв? Или CRC взять?
← →
{RASkov} (2007-04-19 13:20) [5]> [3] _Mouse_ (19.04.07 12:24)
> А код?
Что по твоему должен вернуть твой код при сравнении таких двух текстовВася | Маша
Петя | Гриша
Гуля | Федя
Гриша | Вася
Федя | Питя
Маша | Галя
Некоторые ошибки не случайны.
← →
_Mouse_ (2007-04-19 13:50) [6]Спасибо, но я уже нашел 2 подходящих метода:
Кива и Левенштейн.
← →
Юрий Зотов © (2007-04-19 17:39) [7]Еще можно пощупать Soundex (сравнение строк по "звуковому" образу).
См. в поисковиках.
← →
_Mouse_ (2007-04-19 18:20) [8]Ок. Сенкс :-)
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2007.06.17;
Скачать: [xml.tar.bz2];
Память: 0.46 MB
Время: 0.045 c