Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];
ВнизКак убрать лишние теги в HTML сгенеренных Word ом? Найти похожие ветки
← →
Алексей (2003-05-01 16:02) [0]Столкнулся с проблемой: есть архив ~700мб вышеозначенных HTML, которые нужно выложить на сайт. В целях уменьшения объема файлов требуется выбить лишние теги. Провернуть такое ручками - самобийство. Чую, нужно писать парсер. Как лучше реализовать? Может есть какие-то наработки?
← →
Ик сик (2003-05-01 16:21) [1]Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)
Вообще в DreamWeaver есть такая функция - почистить файлы MS Word, она по-моему так и называется.
Может быть как-то через OLE ее использовать?
← →
Алексей (2003-05-03 22:30) [2]To: Ик сик
> Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)
Не все так просто. Теги-то одинаковые везде (где больше - где меньше), а вот параметры везде разные :) И такая куча :)
К своему счастью нашел на Torry.com простенький бесплатный парсер, прикрутил к нему пару процедур и сижу радуюсь. Правда есть еще некоторые глюки, но без них никуда :)
Спасибо за совет с DreamWeaver, буду копать.
← →
evvcom (2003-05-03 23:29) [3]Если нужен парсер, то можно воспользоваться стандартным из IE (TWebBrowser component), куда лучше-то искать?
Страницы: 1 вся ветка
Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];
Память: 0.44 MB
Время: 0.007 c