Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Вниз

Парсинг текста и использование рег.выражений?   Найти похожие ветки 

 
Pcrepair ©   (2012-03-25 15:35) [0]

Добрый день
Есть необходимость определить сколько раз в тексте встречается заданное слово
=====================================================
Например, слово = "электроника"
Текст = "Консалтинговая компания Accenture опросила 10 000 человек в 10 странах, в том числе в России, и выяснила, как отличаются предпочтения в области Интернета и электроники людей разного возраста."
где встречается похожее слово "электроники" один раз
Программа должна сообщить об одном совпадении
======================================================

Вопрос: какой способ лучше (стабильная работа, скорость обработки, менее сложный код) применить для разработки кода программы:
- код на основе POS или POSex
- сторонний для ДЕЛФИ TRegExpr
- Microsoft VBScript Regular Expressions или TRegExp
- может что то еще появилось?
РАД2010


 
Ega23 ©   (2012-03-25 15:37) [1]

http://delphimaster.net/view/2-1332577830/

А где магическое слово "ПЕРЕМ"?


 
Sha ©   (2012-03-25 15:48) [2]

Для поиска в тексте слов, похожих на ПЕРЕМ,
сначала имеет смысл подвергнуть эту ПЕРЕМ стеммингу,
а затем в цикле воспользоваться функцией PosEx(ПЕРЕМ, Text, Start).


 
Pcrepair ©   (2012-03-25 18:32) [3]

а если сравнивать в отдельном цикле слово "образец" и слово, к примеру "электрон" и "электронный" и при совпадении слов более заданого процента
(к примеру 50%) считать совпадение валидным, можно наверно обойтись без стемминга и прочих усложнений?


 
Sha ©   (2012-03-25 18:37) [4]

автор взял автомат и сел в автобус


 
Pcrepair ©   (2012-03-25 18:44) [5]

ну не будем все усложнять. это ведь не ИИ чтобы различать разницу между автоматами
речь идет о простой программе, способной по простому рассортировать на нужное и не нужное


 
Ega23 ©   (2012-03-26 00:09) [6]


> а если сравнивать в отдельном цикле слово "образец" и слово,
>  к примеру "электрон" и "электронный" и при совпадении слов
> более заданого процента
> (к примеру 50%) считать совпадение валидным, можно наверно
> обойтись без стемминга и прочих усложнений?

http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0


 
Dimka Maslov ©   (2012-03-27 10:28) [7]

Не, гугл зря беспокоится о появлении нового конкурента. Не тот случай


 
Anatoly Podgoretsky ©   (2012-03-27 10:56) [8]

Никакой опасности у Гугла нет.



Страницы: 1 вся ветка

Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.057 c
15-1340886646
alexdn
2012-06-28 16:30
2013.03.22
10-ти дневн демка


15-1353086496
ЕщеОдинКакжеНадоели
2012-11-16 21:21
2013.03.22
Random ный список чисел.


2-1341986411
NBAH19901
2012-07-11 10:00
2013.03.22
Парсинг Json в delphi


1-1298958590
KMSTR
2011-03-01 08:49
2013.03.22
Ошибка отображения выключенных кнопок Toolbar


2-1335292096
artemchik
2012-04-24 22:28
2013.03.22
настройка Delphi





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский