Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];

Вниз

Как убрать лишние теги в HTML сгенеренных Word ом?   Найти похожие ветки 

 
Алексей   (2003-05-01 16:02) [0]

Столкнулся с проблемой: есть архив ~700мб вышеозначенных HTML, которые нужно выложить на сайт. В целях уменьшения объема файлов требуется выбить лишние теги. Провернуть такое ручками - самобийство. Чую, нужно писать парсер. Как лучше реализовать? Может есть какие-то наработки?


 
Ик сик   (2003-05-01 16:21) [1]

Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)
Вообще в DreamWeaver есть такая функция - почистить файлы MS Word, она по-моему так и называется.
Может быть как-то через OLE ее использовать?


 
Алексей   (2003-05-03 22:30) [2]

To: Ик сик

> Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)

Не все так просто. Теги-то одинаковые везде (где больше - где меньше), а вот параметры везде разные :) И такая куча :)
К своему счастью нашел на Torry.com простенький бесплатный парсер, прикрутил к нему пару процедур и сижу радуюсь. Правда есть еще некоторые глюки, но без них никуда :)


Спасибо за совет с DreamWeaver, буду копать.


 
evvcom   (2003-05-03 23:29) [3]

Если нужен парсер, то можно воспользоваться стандартным из IE (TWebBrowser component), куда лучше-то искать?



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.44 MB
Время: 0.008 c
3-46652
Agabr
2003-04-24 16:34
2003.05.15
MIDAS


14-46945
Хороший человек
2003-04-21 20:51
2003.05.15
Посоветуйте, какой ник выбрать


6-46877
AlexMax
2003-03-19 01:55
2003.05.15
Получение информации о расшареном ресурсе


14-46902
data
2003-04-28 11:01
2003.05.15
У нас кошка окотилась - 5 штук котят, такие хорошенькие:)),


14-47008
Style
2003-04-28 08:04
2003.05.15
DelphiChallenge: Первый блин комом :(





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский