Текущий архив: 2006.04.09;
Скачать: CL | DM;
Внизпарсеры Найти похожие ветки
← →
VyaheslavV (2006-03-19 14:02) [0]Доброго времени !
Очень нужны парсеры doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps для разбора текста.
Если кто знает, где взять, киньте пожалуйста ссылку.
← →
pasha_golub © (2006-03-19 16:21) [1]А как это парсер для txt?
ЗЫ И шото у меня дежавю, что точь-в-точь такой вопрос уже был.
← →
tesseract © (2006-03-19 18:36) [2]Парсер для xml/perl это я понимаю.
а вот ppt/pdf/ps/hlp - это пять баллов.
Лучшие парсеры doc/xls/ppt/rtf - MS Word/exel/power point. Их можно открыть через COM.
← →
TStas © (2006-03-19 22:50) [3]Парсер для языка бывает. А что за парсер для txt, doc? Они какие должны лексемы выделять и, главное, что потом с ними делать?
← →
Джо © (2006-03-19 22:53) [4]TStas ©
> А что за парсер для txt, doc? Они какие должны лексемы выделять
> и, главное, что потом с ними делать?
А ничего. Дело парсера — только разобрать.
← →
pasha_golub © (2006-03-20 17:00) [5]
> Джо © (19.03.06 22:53) [4]
А я думал дело лекс. анализатора разобрать... ;0)
← →
Джо © (2006-03-20 19:12) [6]> [5] pasha_golub © (20.03.06 17:00)
> А я думал дело лекс. анализатора разобрать... ;0)
Да, в общем-то, да. :) Но учитывая, что при разборе, скажем rtf вполне можно стадии лексического и синтаксического анализа объединить в одну и назвать это все "разбором", т.е, "парсингом", то... ;)
Кстати, форматы-то эти все неравноценные, так как, например, Post Script (.ps) это уже полноценный язык программирования, чего никак нельзя сказать о формате .doc. :)
← →
pasha_golub © (2006-03-20 19:29) [7]
> Да, в общем-то, да. :) Но учитывая, что при разборе, скажем
> rtf вполне можно стадии лексического и синтаксического анализа
> объединить в одну и назвать это все "разбором", т.е, "парсингом",
> то... ;)
>
Против правды не попрешь.
> стати, форматы-то эти все неравноценные, так как, например,
> Post Script (.ps) это уже полноценный язык программирования,
> чего никак нельзя сказать о формате .doc. :)
>
и тем более .txt :D
← →
Джо © (2006-03-20 19:30) [8]Да, парсер для txt это сильно :))
← →
TStas © (2006-03-20 21:51) [9]>Джо т.е. парсер = лексический анализатор. А ух с лексемами работает синтаксический. ПРосто думал, что парсер - это все вмессте
← →
TStas © (2006-03-21 00:24) [10]А мне парсеры, точнее все всместе, писать даже понравилось. ГРафики произвольных зависимостей красывае получаются, и пишутся просто
http://stas258.narod.ru/frame/download/plotsExe.zip
Страницы: 1 вся ветка
Текущий архив: 2006.04.09;
Скачать: CL | DM;
Память: 0.46 MB
Время: 0.012 c