Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];
ВнизПарсинг текста и использование рег.выражений? Найти похожие ветки
← →
Pcrepair © (2012-03-25 15:35) [0]Добрый день
Есть необходимость определить сколько раз в тексте встречается заданное слово
=====================================================
Например, слово = "электроника"
Текст = "Консалтинговая компания Accenture опросила 10 000 человек в 10 странах, в том числе в России, и выяснила, как отличаются предпочтения в области Интернета и электроники людей разного возраста."
где встречается похожее слово "электроники" один раз
Программа должна сообщить об одном совпадении
======================================================
Вопрос: какой способ лучше (стабильная работа, скорость обработки, менее сложный код) применить для разработки кода программы:
- код на основе POS или POSex
- сторонний для ДЕЛФИ TRegExpr
- Microsoft VBScript Regular Expressions или TRegExp
- может что то еще появилось?
РАД2010
← →
Ega23 © (2012-03-25 15:37) [1]http://delphimaster.net/view/2-1332577830/
А где магическое слово "ПЕРЕМ"?
← →
Sha © (2012-03-25 15:48) [2]Для поиска в тексте слов, похожих на ПЕРЕМ,
сначала имеет смысл подвергнуть эту ПЕРЕМ стеммингу,
а затем в цикле воспользоваться функцией PosEx(ПЕРЕМ, Text, Start).
← →
Pcrepair © (2012-03-25 18:32) [3]а если сравнивать в отдельном цикле слово "образец" и слово, к примеру "электрон" и "электронный" и при совпадении слов более заданого процента
(к примеру 50%) считать совпадение валидным, можно наверно обойтись без стемминга и прочих усложнений?
← →
Sha © (2012-03-25 18:37) [4]автор взял автомат и сел в автобус
← →
Pcrepair © (2012-03-25 18:44) [5]ну не будем все усложнять. это ведь не ИИ чтобы различать разницу между автоматами
речь идет о простой программе, способной по простому рассортировать на нужное и не нужное
← →
Ega23 © (2012-03-26 00:09) [6]
> а если сравнивать в отдельном цикле слово "образец" и слово,
> к примеру "электрон" и "электронный" и при совпадении слов
> более заданого процента
> (к примеру 50%) считать совпадение валидным, можно наверно
> обойтись без стемминга и прочих усложнений?
http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0
← →
Dimka Maslov © (2012-03-27 10:28) [7]Не, гугл зря беспокоится о появлении нового конкурента. Не тот случай
← →
Anatoly Podgoretsky © (2012-03-27 10:56) [8]Никакой опасности у Гугла нет.
Страницы: 1 вся ветка
Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];
Память: 0.46 MB
Время: 0.057 c