Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.04.09;
Скачать: CL | DM;

Вниз

парсеры   Найти похожие ветки 

 
VyaheslavV   (2006-03-19 14:02) [0]

Доброго времени !
Очень нужны парсеры doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps для разбора текста.
Если кто знает, где взять, киньте пожалуйста ссылку.


 
pasha_golub ©   (2006-03-19 16:21) [1]

А как это парсер для txt?

ЗЫ И шото у меня дежавю, что точь-в-точь такой вопрос уже был.


 
tesseract ©   (2006-03-19 18:36) [2]

Парсер для xml/perl это я понимаю.

а вот ppt/pdf/ps/hlp - это пять баллов.

Лучшие парсеры doc/xls/ppt/rtf -  MS Word/exel/power point. Их можно открыть через COM.


 
TStas ©   (2006-03-19 22:50) [3]

Парсер для языка бывает. А что за парсер для txt, doc? Они какие должны лексемы выделять и, главное, что потом с ними делать?


 
Джо ©   (2006-03-19 22:53) [4]

TStas ©
> А что за парсер для txt, doc? Они какие должны лексемы выделять
> и, главное, что потом с ними делать?

А ничего. Дело парсера — только разобрать.


 
pasha_golub ©   (2006-03-20 17:00) [5]


> Джо ©   (19.03.06 22:53) [4]

А я думал дело лекс. анализатора разобрать... ;0)


 
Джо ©   (2006-03-20 19:12) [6]

> [5] pasha_golub ©   (20.03.06 17:00)
> А я думал дело лекс. анализатора разобрать... ;0)

Да, в общем-то, да. :) Но учитывая, что при разборе, скажем rtf вполне можно стадии лексического и синтаксического анализа объединить в одну и назвать это все "разбором", т.е, "парсингом", то... ;)

Кстати, форматы-то эти все неравноценные, так как, например, Post Script (.ps) это уже полноценный язык программирования, чего никак нельзя сказать о формате .doc. :)


 
pasha_golub ©   (2006-03-20 19:29) [7]


> Да, в общем-то, да. :) Но учитывая, что при разборе, скажем
> rtf вполне можно стадии лексического и синтаксического анализа
> объединить в одну и назвать это все "разбором", т.е, "парсингом",
>  то... ;)
>

Против правды не попрешь.


> стати, форматы-то эти все неравноценные, так как, например,
>  Post Script (.ps) это уже полноценный язык программирования,
>  чего никак нельзя сказать о формате .doc. :)
>
и тем более .txt :D


 
Джо ©   (2006-03-20 19:30) [8]

Да, парсер для txt это сильно :))


 
TStas ©   (2006-03-20 21:51) [9]

>Джо т.е. парсер = лексический анализатор. А ух с лексемами работает синтаксический. ПРосто думал, что парсер - это все вмессте


 
TStas ©   (2006-03-21 00:24) [10]

А мне парсеры, точнее все всместе, писать даже понравилось. ГРафики произвольных зависимостей красывае получаются, и пишутся просто
http://stas258.narod.ru/frame/download/plotsExe.zip



Страницы: 1 вся ветка

Текущий архив: 2006.04.09;
Скачать: CL | DM;

Наверх




Память: 0.49 MB
Время: 0.047 c
15-1142840270
Knight
2006-03-20 10:37
2006.04.09
Как перенести настроенный диалап из одного XP в другой?


15-1142694690
Vlad_
2006-03-18 18:11
2006.04.09
Кто напишет простенькую прогу за 5 Баксов(На мобильный или WM)


2-1143240003
Locke
2006-03-25 01:40
2006.04.09
перемещение региона вместе с формой которую он ограничивает


1-1141920092
Fenix
2006-03-09 19:01
2006.04.09
Динамическое создание разделов меню


2-1143099573
marc13
2006-03-23 10:39
2006.04.09
Архив RAR