Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.04.09;
Скачать: CL | DM;

Вниз

парсеры   Найти похожие ветки 

 
VyaheslavV   (2006-03-19 14:02) [0]

Доброго времени !
Очень нужны парсеры doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps для разбора текста.
Если кто знает, где взять, киньте пожалуйста ссылку.


 
pasha_golub ©   (2006-03-19 16:21) [1]

А как это парсер для txt?

ЗЫ И шото у меня дежавю, что точь-в-точь такой вопрос уже был.


 
tesseract ©   (2006-03-19 18:36) [2]

Парсер для xml/perl это я понимаю.

а вот ppt/pdf/ps/hlp - это пять баллов.

Лучшие парсеры doc/xls/ppt/rtf -  MS Word/exel/power point. Их можно открыть через COM.


 
TStas ©   (2006-03-19 22:50) [3]

Парсер для языка бывает. А что за парсер для txt, doc? Они какие должны лексемы выделять и, главное, что потом с ними делать?


 
Джо ©   (2006-03-19 22:53) [4]

TStas ©
> А что за парсер для txt, doc? Они какие должны лексемы выделять
> и, главное, что потом с ними делать?

А ничего. Дело парсера — только разобрать.


 
pasha_golub ©   (2006-03-20 17:00) [5]


> Джо ©   (19.03.06 22:53) [4]

А я думал дело лекс. анализатора разобрать... ;0)


 
Джо ©   (2006-03-20 19:12) [6]

> [5] pasha_golub ©   (20.03.06 17:00)
> А я думал дело лекс. анализатора разобрать... ;0)

Да, в общем-то, да. :) Но учитывая, что при разборе, скажем rtf вполне можно стадии лексического и синтаксического анализа объединить в одну и назвать это все "разбором", т.е, "парсингом", то... ;)

Кстати, форматы-то эти все неравноценные, так как, например, Post Script (.ps) это уже полноценный язык программирования, чего никак нельзя сказать о формате .doc. :)


 
pasha_golub ©   (2006-03-20 19:29) [7]


> Да, в общем-то, да. :) Но учитывая, что при разборе, скажем
> rtf вполне можно стадии лексического и синтаксического анализа
> объединить в одну и назвать это все "разбором", т.е, "парсингом",
>  то... ;)
>

Против правды не попрешь.


> стати, форматы-то эти все неравноценные, так как, например,
>  Post Script (.ps) это уже полноценный язык программирования,
>  чего никак нельзя сказать о формате .doc. :)
>
и тем более .txt :D


 
Джо ©   (2006-03-20 19:30) [8]

Да, парсер для txt это сильно :))


 
TStas ©   (2006-03-20 21:51) [9]

>Джо т.е. парсер = лексический анализатор. А ух с лексемами работает синтаксический. ПРосто думал, что парсер - это все вмессте


 
TStas ©   (2006-03-21 00:24) [10]

А мне парсеры, точнее все всместе, писать даже понравилось. ГРафики произвольных зависимостей красывае получаются, и пишутся просто
http://stas258.narod.ru/frame/download/plotsExe.zip



Страницы: 1 вся ветка

Текущий архив: 2006.04.09;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.046 c
2-1143520222
Rubey
2006-03-28 08:30
2006.04.09
Многостраничная печать


2-1143185634
Lera
2006-03-24 10:33
2006.04.09
другое приложение


2-1143458793
LionMen
2006-03-27 15:26
2006.04.09
Срочно!!!!


3-1139917696
V-kras
2006-02-14 14:48
2006.04.09
Поиск нескольких слов в тексте


1-1141626217
set45465
2006-03-06 09:23
2006.04.09
Исключительные ситуации