Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.05.15;
Скачать: CL | DM;

Вниз

Как убрать лишние теги в HTML сгенеренных Word ом?   Найти похожие ветки 

 
Алексей   (2003-05-01 16:02) [0]

Столкнулся с проблемой: есть архив ~700мб вышеозначенных HTML, которые нужно выложить на сайт. В целях уменьшения объема файлов требуется выбить лишние теги. Провернуть такое ручками - самобийство. Чую, нужно писать парсер. Как лучше реализовать? Может есть какие-то наработки?


 
Ик сик   (2003-05-01 16:21) [1]

Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)
Вообще в DreamWeaver есть такая функция - почистить файлы MS Word, она по-моему так и называется.
Может быть как-то через OLE ее использовать?


 
Алексей   (2003-05-03 22:30) [2]

To: Ик сик

> Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)

Не все так просто. Теги-то одинаковые везде (где больше - где меньше), а вот параметры везде разные :) И такая куча :)
К своему счастью нашел на Torry.com простенький бесплатный парсер, прикрутил к нему пару процедур и сижу радуюсь. Правда есть еще некоторые глюки, но без них никуда :)


Спасибо за совет с DreamWeaver, буду копать.


 
evvcom ©   (2003-05-03 23:29) [3]

Если нужен парсер, то можно воспользоваться стандартным из IE (TWebBrowser component), куда лучше-то искать?



Страницы: 1 вся ветка

Текущий архив: 2003.05.15;
Скачать: CL | DM;

Наверх




Память: 0.47 MB
Время: 0.016 c
11-46672
Igit
2002-08-12 09:38
2003.05.15
Вот заглянул в исходники KOL и...


1-46758
Inan61
2003-04-27 18:26
2003.05.15
Работа с файлами. Простой пример.


3-46658
_Narayan_
2003-04-24 17:04
2003.05.15
Хранимая процедура....


14-46971
Delirium^.Tremens
2003-04-25 09:29
2003.05.15
Возвращение DT


14-47007
Zilog
2003-04-28 15:45
2003.05.15
Как можно организовать TimeOut?