Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2007.06.17;
Скачать: [xml.tar.bz2];

Вниз

Сравнение текста   Найти похожие ветки 

 
_Mouse_   (2007-04-19 09:52) [0]

Добрый день мастера. Имею задачу сравнить 2 текста (~3-5 тыс. знаков) на уникальность друг от друга и вывести результат в ввиде % или неких баллов.
Пробовал легкими алгоритмами, но не получается так как в тексте могут вставлены и пропущены слова, предложения. Могут абзацы поменяться местами. Может все что угодно.
Есть у когото на примете алгоритмы или ф-ции для такого мероприятия?
Заранее спасибо.


 
Правильный Вася   (2007-04-19 11:25) [1]


> в ввиде % или неких баллов.

от этого агоритм и зависит


 
Jeer ©   (2007-04-19 12:05) [2]


> Может все что угодно



> Есть у когото на примете


Человек.


 
_Mouse_   (2007-04-19 12:24) [3]


>
> > в ввиде % или неких баллов.
>
> от этого агоритм и зависит
>

Если баллы от 1 до 100 - это и есть проценты.


> Человек.

А код?


 
Desdechado ©   (2007-04-19 12:51) [4]

> Может все что угодно.
Как тогда определить степень совпадения твоих текстов? По количеству одинаковых букв? Или CRC взять?


 
{RASkov}   (2007-04-19 13:20) [5]

> [3] _Mouse_   (19.04.07 12:24)
> А код?

Что по твоему должен вернуть твой код при сравнении таких двух текстов
Вася    |  Маша
Петя    |  Гриша
Гуля    |  Федя
Гриша   |  Вася
Федя    |  Питя
Маша    |  Галя

Некоторые ошибки не случайны.


 
_Mouse_   (2007-04-19 13:50) [6]

Спасибо, но я уже нашел 2 подходящих метода:
Кива и Левенштейн.


 
Юрий Зотов ©   (2007-04-19 17:39) [7]

Еще можно пощупать Soundex (сравнение строк по "звуковому" образу).
См. в поисковиках.


 
_Mouse_   (2007-04-19 18:20) [8]

Ок. Сенкс :-)



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2007.06.17;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.037 c
15-1180009172
Zagaevskiy
2007-05-24 16:19
2007.06.17
Почему-то немогу написать сообщение


2-1180290744
Bogdan1024
2007-05-27 22:32
2007.06.17
case () of для энумированных величин


3-1174936697
ChainickDenis
2007-03-26 23:18
2007.06.17
Что-то не соображу как запрос сформировать, пожскжите плиз...


15-1179686997
ProgRAMmer Dimonych
2007-05-20 22:49
2007.06.17
Помнится были здесь лингвисты...


2-1180337522
vpbar
2007-05-28 11:32
2007.06.17
Ошибка компилятора Delphi или просто особенность??





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский