Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.04.09;
Скачать: CL | DM;

Вниз

парсеры   Найти похожие ветки 

 
VyaheslavV   (2006-03-19 14:02) [0]

Доброго времени !
Очень нужны парсеры doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps для разбора текста.
Если кто знает, где взять, киньте пожалуйста ссылку.


 
pasha_golub ©   (2006-03-19 16:21) [1]

А как это парсер для txt?

ЗЫ И шото у меня дежавю, что точь-в-точь такой вопрос уже был.


 
tesseract ©   (2006-03-19 18:36) [2]

Парсер для xml/perl это я понимаю.

а вот ppt/pdf/ps/hlp - это пять баллов.

Лучшие парсеры doc/xls/ppt/rtf -  MS Word/exel/power point. Их можно открыть через COM.


 
TStas ©   (2006-03-19 22:50) [3]

Парсер для языка бывает. А что за парсер для txt, doc? Они какие должны лексемы выделять и, главное, что потом с ними делать?


 
Джо ©   (2006-03-19 22:53) [4]

TStas ©
> А что за парсер для txt, doc? Они какие должны лексемы выделять
> и, главное, что потом с ними делать?

А ничего. Дело парсера — только разобрать.


 
pasha_golub ©   (2006-03-20 17:00) [5]


> Джо ©   (19.03.06 22:53) [4]

А я думал дело лекс. анализатора разобрать... ;0)


 
Джо ©   (2006-03-20 19:12) [6]

> [5] pasha_golub ©   (20.03.06 17:00)
> А я думал дело лекс. анализатора разобрать... ;0)

Да, в общем-то, да. :) Но учитывая, что при разборе, скажем rtf вполне можно стадии лексического и синтаксического анализа объединить в одну и назвать это все "разбором", т.е, "парсингом", то... ;)

Кстати, форматы-то эти все неравноценные, так как, например, Post Script (.ps) это уже полноценный язык программирования, чего никак нельзя сказать о формате .doc. :)


 
pasha_golub ©   (2006-03-20 19:29) [7]


> Да, в общем-то, да. :) Но учитывая, что при разборе, скажем
> rtf вполне можно стадии лексического и синтаксического анализа
> объединить в одну и назвать это все "разбором", т.е, "парсингом",
>  то... ;)
>

Против правды не попрешь.


> стати, форматы-то эти все неравноценные, так как, например,
>  Post Script (.ps) это уже полноценный язык программирования,
>  чего никак нельзя сказать о формате .doc. :)
>
и тем более .txt :D


 
Джо ©   (2006-03-20 19:30) [8]

Да, парсер для txt это сильно :))


 
TStas ©   (2006-03-20 21:51) [9]

>Джо т.е. парсер = лексический анализатор. А ух с лексемами работает синтаксический. ПРосто думал, что парсер - это все вмессте


 
TStas ©   (2006-03-21 00:24) [10]

А мне парсеры, точнее все всместе, писать даже понравилось. ГРафики произвольных зависимостей красывае получаются, и пишутся просто
http://stas258.narod.ru/frame/download/plotsExe.zip



Страницы: 1 вся ветка

Текущий архив: 2006.04.09;
Скачать: CL | DM;

Наверх




Память: 0.46 MB
Время: 0.011 c
15-1142588143
LordOfRock
2006-03-17 12:35
2006.04.09
Учебник по Firebird


15-1142838252
Ega23
2006-03-20 10:04
2006.04.09
С Днём рождения! 19 марта


2-1143521263
Ezorcist
2006-03-28 08:47
2006.04.09
Вопрос по массивам


2-1143386444
AlexanderMS
2006-03-26 19:20
2006.04.09
Сочетание клавиш


6-1135458339
FH
2005-12-25 00:05
2006.04.09
Плагин к миранде





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский