Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.04.09;
Скачать: CL | DM;

Вниз

парсеры   Найти похожие ветки 

 
VyaheslavV   (2006-03-19 14:02) [0]

Доброго времени !
Очень нужны парсеры doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps для разбора текста.
Если кто знает, где взять, киньте пожалуйста ссылку.


 
pasha_golub ©   (2006-03-19 16:21) [1]

А как это парсер для txt?

ЗЫ И шото у меня дежавю, что точь-в-точь такой вопрос уже был.


 
tesseract ©   (2006-03-19 18:36) [2]

Парсер для xml/perl это я понимаю.

а вот ppt/pdf/ps/hlp - это пять баллов.

Лучшие парсеры doc/xls/ppt/rtf -  MS Word/exel/power point. Их можно открыть через COM.


 
TStas ©   (2006-03-19 22:50) [3]

Парсер для языка бывает. А что за парсер для txt, doc? Они какие должны лексемы выделять и, главное, что потом с ними делать?


 
Джо ©   (2006-03-19 22:53) [4]

TStas ©
> А что за парсер для txt, doc? Они какие должны лексемы выделять
> и, главное, что потом с ними делать?

А ничего. Дело парсера — только разобрать.


 
pasha_golub ©   (2006-03-20 17:00) [5]


> Джо ©   (19.03.06 22:53) [4]

А я думал дело лекс. анализатора разобрать... ;0)


 
Джо ©   (2006-03-20 19:12) [6]

> [5] pasha_golub ©   (20.03.06 17:00)
> А я думал дело лекс. анализатора разобрать... ;0)

Да, в общем-то, да. :) Но учитывая, что при разборе, скажем rtf вполне можно стадии лексического и синтаксического анализа объединить в одну и назвать это все "разбором", т.е, "парсингом", то... ;)

Кстати, форматы-то эти все неравноценные, так как, например, Post Script (.ps) это уже полноценный язык программирования, чего никак нельзя сказать о формате .doc. :)


 
pasha_golub ©   (2006-03-20 19:29) [7]


> Да, в общем-то, да. :) Но учитывая, что при разборе, скажем
> rtf вполне можно стадии лексического и синтаксического анализа
> объединить в одну и назвать это все "разбором", т.е, "парсингом",
>  то... ;)
>

Против правды не попрешь.


> стати, форматы-то эти все неравноценные, так как, например,
>  Post Script (.ps) это уже полноценный язык программирования,
>  чего никак нельзя сказать о формате .doc. :)
>
и тем более .txt :D


 
Джо ©   (2006-03-20 19:30) [8]

Да, парсер для txt это сильно :))


 
TStas ©   (2006-03-20 21:51) [9]

>Джо т.е. парсер = лексический анализатор. А ух с лексемами работает синтаксический. ПРосто думал, что парсер - это все вмессте


 
TStas ©   (2006-03-21 00:24) [10]

А мне парсеры, точнее все всместе, писать даже понравилось. ГРафики произвольных зависимостей красывае получаются, и пишутся просто
http://stas258.narod.ru/frame/download/plotsExe.zip



Страницы: 1 вся ветка

Текущий архив: 2006.04.09;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.026 c
2-1143458664
VAZMan
2006-03-27 15:24
2006.04.09
Record


15-1142911668
Parus
2006-03-21 06:27
2006.04.09
Тайные конференции


15-1142772733
kaif
2006-03-19 15:52
2006.04.09
Определение понятия "иметь".


3-1139644942
John_Doe
2006-02-11 11:02
2006.04.09
Взять из таблицы записи со значениями из комбобокса.


3-1139874950
rosl
2006-02-14 02:55
2006.04.09
регистр букв