Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2013.03.22;
Скачать: CL | DM;

Вниз

Парсинг текста и использование рег.выражений?   Найти похожие ветки 

 
Pcrepair ©   (2012-03-25 15:35) [0]

Добрый день
Есть необходимость определить сколько раз в тексте встречается заданное слово
=====================================================
Например, слово = "электроника"
Текст = "Консалтинговая компания Accenture опросила 10 000 человек в 10 странах, в том числе в России, и выяснила, как отличаются предпочтения в области Интернета и электроники людей разного возраста."
где встречается похожее слово "электроники" один раз
Программа должна сообщить об одном совпадении
======================================================

Вопрос: какой способ лучше (стабильная работа, скорость обработки, менее сложный код) применить для разработки кода программы:
- код на основе POS или POSex
- сторонний для ДЕЛФИ TRegExpr
- Microsoft VBScript Regular Expressions или TRegExp
- может что то еще появилось?
РАД2010


 
Ega23 ©   (2012-03-25 15:37) [1]

http://delphimaster.net/view/2-1332577830/

А где магическое слово "ПЕРЕМ"?


 
Sha ©   (2012-03-25 15:48) [2]

Для поиска в тексте слов, похожих на ПЕРЕМ,
сначала имеет смысл подвергнуть эту ПЕРЕМ стеммингу,
а затем в цикле воспользоваться функцией PosEx(ПЕРЕМ, Text, Start).


 
Pcrepair ©   (2012-03-25 18:32) [3]

а если сравнивать в отдельном цикле слово "образец" и слово, к примеру "электрон" и "электронный" и при совпадении слов более заданого процента
(к примеру 50%) считать совпадение валидным, можно наверно обойтись без стемминга и прочих усложнений?


 
Sha ©   (2012-03-25 18:37) [4]

автор взял автомат и сел в автобус


 
Pcrepair ©   (2012-03-25 18:44) [5]

ну не будем все усложнять. это ведь не ИИ чтобы различать разницу между автоматами
речь идет о простой программе, способной по простому рассортировать на нужное и не нужное


 
Ega23 ©   (2012-03-26 00:09) [6]


> а если сравнивать в отдельном цикле слово "образец" и слово,
>  к примеру "электрон" и "электронный" и при совпадении слов
> более заданого процента
> (к примеру 50%) считать совпадение валидным, можно наверно
> обойтись без стемминга и прочих усложнений?

http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0


 
Dimka Maslov ©   (2012-03-27 10:28) [7]

Не, гугл зря беспокоится о появлении нового конкурента. Не тот случай


 
Anatoly Podgoretsky ©   (2012-03-27 10:56) [8]

Никакой опасности у Гугла нет.



Страницы: 1 вся ветка

Текущий архив: 2013.03.22;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.05 c
2-1347440975
toropoff
2012-09-12 13:09
2013.03.22
неверная установка позиции окна


6-1262631738
Антон80
2010-01-04 22:02
2013.03.22
Проблема с темой письма в TIdSMTP


2-1347207508
Wadimka
2012-09-09 20:18
2013.03.22
Как запустить cmd.exe как в TotalCommander?


15-1354038522
Дмитрий С
2012-11-27 21:48
2013.03.22
Менеджер паролей.


15-1346424190
alexdn
2012-08-31 18:43
2013.03.22
sitemap.xml