Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2013.03.22;
Скачать: CL | DM;

Вниз

Парсинг текста и использование рег.выражений?   Найти похожие ветки 

 
Pcrepair ©   (2012-03-25 15:35) [0]

Добрый день
Есть необходимость определить сколько раз в тексте встречается заданное слово
=====================================================
Например, слово = "электроника"
Текст = "Консалтинговая компания Accenture опросила 10 000 человек в 10 странах, в том числе в России, и выяснила, как отличаются предпочтения в области Интернета и электроники людей разного возраста."
где встречается похожее слово "электроники" один раз
Программа должна сообщить об одном совпадении
======================================================

Вопрос: какой способ лучше (стабильная работа, скорость обработки, менее сложный код) применить для разработки кода программы:
- код на основе POS или POSex
- сторонний для ДЕЛФИ TRegExpr
- Microsoft VBScript Regular Expressions или TRegExp
- может что то еще появилось?
РАД2010


 
Ega23 ©   (2012-03-25 15:37) [1]

http://delphimaster.net/view/2-1332577830/

А где магическое слово "ПЕРЕМ"?


 
Sha ©   (2012-03-25 15:48) [2]

Для поиска в тексте слов, похожих на ПЕРЕМ,
сначала имеет смысл подвергнуть эту ПЕРЕМ стеммингу,
а затем в цикле воспользоваться функцией PosEx(ПЕРЕМ, Text, Start).


 
Pcrepair ©   (2012-03-25 18:32) [3]

а если сравнивать в отдельном цикле слово "образец" и слово, к примеру "электрон" и "электронный" и при совпадении слов более заданого процента
(к примеру 50%) считать совпадение валидным, можно наверно обойтись без стемминга и прочих усложнений?


 
Sha ©   (2012-03-25 18:37) [4]

автор взял автомат и сел в автобус


 
Pcrepair ©   (2012-03-25 18:44) [5]

ну не будем все усложнять. это ведь не ИИ чтобы различать разницу между автоматами
речь идет о простой программе, способной по простому рассортировать на нужное и не нужное


 
Ega23 ©   (2012-03-26 00:09) [6]


> а если сравнивать в отдельном цикле слово "образец" и слово,
>  к примеру "электрон" и "электронный" и при совпадении слов
> более заданого процента
> (к примеру 50%) считать совпадение валидным, можно наверно
> обойтись без стемминга и прочих усложнений?

http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0


 
Dimka Maslov ©   (2012-03-27 10:28) [7]

Не, гугл зря беспокоится о появлении нового конкурента. Не тот случай


 
Anatoly Podgoretsky ©   (2012-03-27 10:56) [8]

Никакой опасности у Гугла нет.



Страницы: 1 вся ветка

Текущий архив: 2013.03.22;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.074 c
2-1339237885
Savek
2012-06-09 14:31
2013.03.22
Не удаётся сохранить картинку


6-1261579139
ZV
2009-12-23 17:38
2013.03.22
Client и Server. Как сделать надежно и просто ?


15-1336765355
Rouse_
2012-05-11 23:42
2013.03.22
Схемы защиты ПО


15-1339144160
xayam
2012-06-08 12:29
2013.03.22
Визуальное программирование


15-1329856202
Юрий
2012-02-22 00:30
2013.03.22
С днем рождения ! 22 февраля 2012 среда