Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2006.04.09;
Скачать: CL | DM;

Вниз

парсеры   Найти похожие ветки 

 
VyaheslavV   (2006-03-19 14:02) [0]

Доброго времени !
Очень нужны парсеры doc, rtf, txt, pdf, html, tex, chm, hlp, ppt, ps для разбора текста.
Если кто знает, где взять, киньте пожалуйста ссылку.


 
pasha_golub ©   (2006-03-19 16:21) [1]

А как это парсер для txt?

ЗЫ И шото у меня дежавю, что точь-в-точь такой вопрос уже был.


 
tesseract ©   (2006-03-19 18:36) [2]

Парсер для xml/perl это я понимаю.

а вот ppt/pdf/ps/hlp - это пять баллов.

Лучшие парсеры doc/xls/ppt/rtf -  MS Word/exel/power point. Их можно открыть через COM.


 
TStas ©   (2006-03-19 22:50) [3]

Парсер для языка бывает. А что за парсер для txt, doc? Они какие должны лексемы выделять и, главное, что потом с ними делать?


 
Джо ©   (2006-03-19 22:53) [4]

TStas ©
> А что за парсер для txt, doc? Они какие должны лексемы выделять
> и, главное, что потом с ними делать?

А ничего. Дело парсера — только разобрать.


 
pasha_golub ©   (2006-03-20 17:00) [5]


> Джо ©   (19.03.06 22:53) [4]

А я думал дело лекс. анализатора разобрать... ;0)


 
Джо ©   (2006-03-20 19:12) [6]

> [5] pasha_golub ©   (20.03.06 17:00)
> А я думал дело лекс. анализатора разобрать... ;0)

Да, в общем-то, да. :) Но учитывая, что при разборе, скажем rtf вполне можно стадии лексического и синтаксического анализа объединить в одну и назвать это все "разбором", т.е, "парсингом", то... ;)

Кстати, форматы-то эти все неравноценные, так как, например, Post Script (.ps) это уже полноценный язык программирования, чего никак нельзя сказать о формате .doc. :)


 
pasha_golub ©   (2006-03-20 19:29) [7]


> Да, в общем-то, да. :) Но учитывая, что при разборе, скажем
> rtf вполне можно стадии лексического и синтаксического анализа
> объединить в одну и назвать это все "разбором", т.е, "парсингом",
>  то... ;)
>

Против правды не попрешь.


> стати, форматы-то эти все неравноценные, так как, например,
>  Post Script (.ps) это уже полноценный язык программирования,
>  чего никак нельзя сказать о формате .doc. :)
>
и тем более .txt :D


 
Джо ©   (2006-03-20 19:30) [8]

Да, парсер для txt это сильно :))


 
TStas ©   (2006-03-20 21:51) [9]

>Джо т.е. парсер = лексический анализатор. А ух с лексемами работает синтаксический. ПРосто думал, что парсер - это все вмессте


 
TStas ©   (2006-03-21 00:24) [10]

А мне парсеры, точнее все всместе, писать даже понравилось. ГРафики произвольных зависимостей красывае получаются, и пишутся просто
http://stas258.narod.ru/frame/download/plotsExe.zip



Страницы: 1 вся ветка

Текущий архив: 2006.04.09;
Скачать: CL | DM;

Наверх




Память: 0.46 MB
Время: 0.012 c
15-1142073530
Nikolay M.
2006-03-11 13:38
2006.04.09
В очередной раз рискну разместить здесь вакансию


15-1142345654
ZeFiR
2006-03-14 17:14
2006.04.09
Эмуляторы для запуска sis файлов(приложения нокия-смартов)


1-1141889194
sapsi
2006-03-09 10:26
2006.04.09
получить название ссылки в вебраузере


6-1135668708
vista
2005-12-27 10:31
2006.04.09
извлечь текст из html страницы.без html-тегов


2-1143184401
mmms
2006-03-24 10:13
2006.04.09
Здравствуйте! Простите за простой вопрос, не могу преобразовать





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский