Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Вниз

Парсинг текста и использование рег.выражений?   Найти похожие ветки 

 
Pcrepair ©   (2012-03-25 15:35) [0]

Добрый день
Есть необходимость определить сколько раз в тексте встречается заданное слово
=====================================================
Например, слово = "электроника"
Текст = "Консалтинговая компания Accenture опросила 10 000 человек в 10 странах, в том числе в России, и выяснила, как отличаются предпочтения в области Интернета и электроники людей разного возраста."
где встречается похожее слово "электроники" один раз
Программа должна сообщить об одном совпадении
======================================================

Вопрос: какой способ лучше (стабильная работа, скорость обработки, менее сложный код) применить для разработки кода программы:
- код на основе POS или POSex
- сторонний для ДЕЛФИ TRegExpr
- Microsoft VBScript Regular Expressions или TRegExp
- может что то еще появилось?
РАД2010


 
Ega23 ©   (2012-03-25 15:37) [1]

http://delphimaster.net/view/2-1332577830/

А где магическое слово "ПЕРЕМ"?


 
Sha ©   (2012-03-25 15:48) [2]

Для поиска в тексте слов, похожих на ПЕРЕМ,
сначала имеет смысл подвергнуть эту ПЕРЕМ стеммингу,
а затем в цикле воспользоваться функцией PosEx(ПЕРЕМ, Text, Start).


 
Pcrepair ©   (2012-03-25 18:32) [3]

а если сравнивать в отдельном цикле слово "образец" и слово, к примеру "электрон" и "электронный" и при совпадении слов более заданого процента
(к примеру 50%) считать совпадение валидным, можно наверно обойтись без стемминга и прочих усложнений?


 
Sha ©   (2012-03-25 18:37) [4]

автор взял автомат и сел в автобус


 
Pcrepair ©   (2012-03-25 18:44) [5]

ну не будем все усложнять. это ведь не ИИ чтобы различать разницу между автоматами
речь идет о простой программе, способной по простому рассортировать на нужное и не нужное


 
Ega23 ©   (2012-03-26 00:09) [6]


> а если сравнивать в отдельном цикле слово "образец" и слово,
>  к примеру "электрон" и "электронный" и при совпадении слов
> более заданого процента
> (к примеру 50%) считать совпадение валидным, можно наверно
> обойтись без стемминга и прочих усложнений?

http://ru.wikipedia.org/wiki/%D0%A0%D0%B0%D1%81%D1%81%D1%82%D0%BE%D1%8F%D0%BD%D0%B8%D0%B5_%D0%9B%D0%B5%D0%B2%D0%B5%D0%BD%D1%88%D1%82%D0%B5%D0%B9%D0%BD%D0%B0


 
Dimka Maslov ©   (2012-03-27 10:28) [7]

Не, гугл зря беспокоится о появлении нового конкурента. Не тот случай


 
Anatoly Podgoretsky ©   (2012-03-27 10:56) [8]

Никакой опасности у Гугла нет.



Страницы: 1 вся ветка

Форум: "Начинающим";
Текущий архив: 2013.03.22;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.46 MB
Время: 0.06 c
2-1336838970
АлексеЕей
2012-05-12 20:09
2013.03.22
Задача по информатике


15-1333095615
Медвежонок Пятачок
2012-03-30 12:20
2013.03.22
oiosaml.java


3-1282030520
scott
2010-08-17 11:35
2013.03.22
аналог for xml auto для оракла


2-1331645587
Сергей
2012-03-13 17:33
2013.03.22
Компонент Delphi для Clob Oracle?


3-1277112330
alexnauz
2010-06-21 13:25
2013.03.22
Как заставить IBQuery или OraQuery вернуть пустой результат





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский