Форум: "Потрепаться";
Текущий архив: 2003.05.01;
Скачать: [xml.tar.bz2];
ВнизЕсть ли где парсер для HTML? Найти похожие ветки
← →
Lin (2003-04-11 11:30) [0]ПОдскажите, хочу парсить html и в зависимоти от тагов выполнять определенные действия с текстом. Где можно посмотреть алгоритмы или исходники.
← →
malkolinge (2003-04-11 11:44) [1]самому думать и про строковые функции читать
← →
panov (2003-04-11 12:44) [2]Попробуй в инете поискать...
← →
Дмитрий К.К. (2003-04-11 13:07) [3]На Торри видал такой. Весьма мощный.
← →
nikkie (2003-04-11 13:13) [4]см. MSDN на тему IHTMLDocument2
можно маленький пример посмотреть здесь:
http://www.codeguru.com/ieprogram/HTMLParsing.html
только имхо, там совершенно зря IMarkupServices используются - они требуют IE5, для парсинга вполне хватит IHTMLTxtRange и IHTMLElement - для них хватает IE4.
← →
Ihor Osov'yak (2003-04-11 14:12) [5]MSDN - Reusing Browser Technology.
grouts/google.com - Поиск по ключевым словам
delphi mshtml IHTMLElement IHTMLDocument2
для начала -
http://delphi.vitpc.com/mastering/tweb.htm
← →
Master-Igor (2003-04-12 12:05) [6]Меня етат вапрос тоже интересен:)))) Но уменя ищо вазникаєт, как витащить все URL из страници, где есть скріпти????????????
← →
Ihor Osov'yak (2003-04-12 12:39) [7]2 Master-Igor © (12.04.03 12:05)
Я конечно понимаю, что во Львове русский в школе не изучают, но нужно же меру какую-то иметь, ... с. КЛД..
Пиши лучше на английском..
Зы - однако есть подозрение, что на родном ты не очень то грамотнее..
← →
anpsoft (2003-04-12 13:02) [8]rjHtmlParser Version 0.1a freeware
Copyright (c) 2000 by Ralf Junker <ralfjunker@gmx.de>.
rjHtmlParser includes three components: THtmlReporter, THtmlWriter, and
THtmlAutoWriter. They allow fast and flexible parsing and writing of HTML files.
Some of their features are:
* Very flexible interface. Read HTML files from any source and write to any
destination by as-signing your own OnReadChar function. The parser will only
read one character at a time, so you can even parse files of unlimited size.
* Advanced filtering options: THtmlReporter and THtmlAutoWriter allow to include
or exclude all 8 elements (ASP, Comments, DTD, Scripts, SSI, Styles, Tags and
Text) into the reporting or auto-writing. Filters for tags can be set for
starttags and endtags separately.
* Proper handling of preformatted text.
* Conversion of HTML character entities.
Страницы: 1 вся ветка
Форум: "Потрепаться";
Текущий архив: 2003.05.01;
Скачать: [xml.tar.bz2];
Память: 0.46 MB
Время: 0.006 c