Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];

Вниз

Как убрать лишние теги в HTML сгенеренных Word ом?   Найти похожие ветки 

 
Алексей   (2003-05-01 16:02) [0]

Столкнулся с проблемой: есть архив ~700мб вышеозначенных HTML, которые нужно выложить на сайт. В целях уменьшения объема файлов требуется выбить лишние теги. Провернуть такое ручками - самобийство. Чую, нужно писать парсер. Как лучше реализовать? Может есть какие-то наработки?


 
Ик сик   (2003-05-01 16:21) [1]

Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)
Вообще в DreamWeaver есть такая функция - почистить файлы MS Word, она по-моему так и называется.
Может быть как-то через OLE ее использовать?


 
Алексей   (2003-05-03 22:30) [2]

To: Ик сик

> Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)

Не все так просто. Теги-то одинаковые везде (где больше - где меньше), а вот параметры везде разные :) И такая куча :)
К своему счастью нашел на Torry.com простенький бесплатный парсер, прикрутил к нему пару процедур и сижу радуюсь. Правда есть еще некоторые глюки, но без них никуда :)


Спасибо за совет с DreamWeaver, буду копать.


 
evvcom   (2003-05-03 23:29) [3]

Если нужен парсер, то можно воспользоваться стандартным из IE (TWebBrowser component), куда лучше-то искать?



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.44 MB
Время: 0.007 c
4-47044
DeadMeat
2003-03-15 20:30
2003.05.15
Docking


14-46912
KA-87
2003-04-26 20:26
2003.05.15
Как засунуть свою прогу в меню


1-46765
Helldriver
2003-04-29 23:34
2003.05.15
Обработка exception ов из главного модуля приложения


1-46736
Great DAN
2003-05-05 06:21
2003.05.15
Выделить всю строку в StringGrid


1-46738
Mishenka
2003-05-04 21:01
2003.05.15
Господа помогите, несоздаются компоненты :(((





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский