Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];

Вниз

Как убрать лишние теги в HTML сгенеренных Word ом?   Найти похожие ветки 

 
Алексей   (2003-05-01 16:02) [0]

Столкнулся с проблемой: есть архив ~700мб вышеозначенных HTML, которые нужно выложить на сайт. В целях уменьшения объема файлов требуется выбить лишние теги. Провернуть такое ручками - самобийство. Чую, нужно писать парсер. Как лучше реализовать? Может есть какие-то наработки?


 
Ик сик   (2003-05-01 16:21) [1]

Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)
Вообще в DreamWeaver есть такая функция - почистить файлы MS Word, она по-моему так и называется.
Может быть как-то через OLE ее использовать?


 
Алексей   (2003-05-03 22:30) [2]

To: Ик сик

> Если знаешь какие именно теги, то зачем парсер? Просто удаляй их все :)

Не все так просто. Теги-то одинаковые везде (где больше - где меньше), а вот параметры везде разные :) И такая куча :)
К своему счастью нашел на Torry.com простенький бесплатный парсер, прикрутил к нему пару процедур и сижу радуюсь. Правда есть еще некоторые глюки, но без них никуда :)


Спасибо за совет с DreamWeaver, буду копать.


 
evvcom   (2003-05-03 23:29) [3]

Если нужен парсер, то можно воспользоваться стандартным из IE (TWebBrowser component), куда лучше-то искать?



Страницы: 1 вся ветка

Форум: "Основная";
Текущий архив: 2003.05.15;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.44 MB
Время: 0.007 c
1-46740
NEEDhelp
2003-05-04 21:55
2003.05.15
Как можно заставить Делфи открыть outlook и добавить туда текст


6-46868
nikolo
2003-03-18 13:08
2003.05.15
FTP + DialUp


14-46908
DenisS
2003-04-28 16:34
2003.05.15
Threads и Dll


14-46968
defind
2003-04-27 06:13
2003.05.15
combats.ru, опрос:


6-46870
sapsi
2003-03-18 08:22
2003.05.15
Организация удаленного подключения к локальной сети





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский