Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2002.03.25;
Скачать: CL | DM;

Вниз

Парсинг   Найти похожие ветки 

 
Alexandr ©   (2002-03-12 15:05) [0]

Есть ли какие наработки по парсингу строк.
Т.е , например, есть прайс произвольного текстового формата, необходимо выделить наименование, количество и цену каждой позиции. При этом нужен, естественно, некоторый интеллект в разборе прайса.

Есть ли стандартные парсеры, или какие алгоритмы или еще чего есть?
Хоть в какую сторону смотреть?


 
Romkin ©   (2002-03-12 15:23) [1]

Ничего себе вопрос - на уровне искусственного интеллекта :-))
Я когда-то делал что-то подобное, с импортом из Эксела (там проще - все по ячейкам)
В результате получилось нечто - сначала программа определяла границы собственно таблицы (наименование-стоимость), по признаку в строке слова и цифры, потом пыталась брать в свой grid все данные и предлагала пользователю сравнение, с возможностью поправить границы и тд, а также сохранить конфигурацию.
В общем, получалось что-то вроде импорта как в Экселе


 
Alexandr ©   (2002-03-12 15:37) [2]

да если хорошо подумать, то ничего особенно сложного нет.
Конечно, не 100% разбор будет, но все-равно кое-чего тут наделать можно. И это кое-что, я думаю будет нормально обрабатывать до 80% прайсов. И на том хорошо.


 
Дмитрий ©   (2002-03-12 15:41) [3]

Регулярные выражения.
http://delphi.vitpc.com/mastering/strings_birds_eye_view.htm


 
Alexandr ©   (2002-03-12 15:47) [4]

вот это уже ближе к телу.
Регулярные выражения и будем смотреть...


 
Владислав ©   (2002-03-12 16:05) [5]

Есть у меня программа на перле, которая "вытаскивает" данные из текстовых файлов произвольного формата и преобразует в текстовые форматированные файлы. Пиши на email, отвечу программой.



Страницы: 1 вся ветка

Текущий архив: 2002.03.25;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.008 c
3-80399
sniknik
2002-02-21 17:16
2002.03.25
Таблица Pardox без первичного ключа не отдается полным доступом.


1-80518
Nuce
2002-03-13 02:53
2002.03.25
TPagecontrol?


1-80557
Lion
2002-03-09 23:49
2002.03.25
StringGrid


1-80594
dim2001
2002-03-11 11:30
2002.03.25
canvas.font.width


1-80522
jenbond
2002-03-13 10:15
2002.03.25
Шифрование