Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.05.01;
Скачать: CL | DM;

Вниз

Есть ли где парсер для HTML?   Найти похожие ветки 

 
Lin   (2003-04-11 11:30) [0]

ПОдскажите, хочу парсить html и в зависимоти от тагов выполнять определенные действия с текстом. Где можно посмотреть алгоритмы или исходники.


 
malkolinge ©   (2003-04-11 11:44) [1]

самому думать и про строковые функции читать


 
panov ©   (2003-04-11 12:44) [2]

Попробуй в инете поискать...


 
Дмитрий К.К. ©   (2003-04-11 13:07) [3]

На Торри видал такой. Весьма мощный.


 
nikkie ©   (2003-04-11 13:13) [4]

см. MSDN на тему IHTMLDocument2
можно маленький пример посмотреть здесь:
http://www.codeguru.com/ieprogram/HTMLParsing.html

только имхо, там совершенно зря IMarkupServices используются - они требуют IE5, для парсинга вполне хватит IHTMLTxtRange и IHTMLElement - для них хватает IE4.


 
Ihor Osov'yak ©   (2003-04-11 14:12) [5]

MSDN - Reusing Browser Technology.
grouts/google.com - Поиск по ключевым словам
delphi mshtml IHTMLElement IHTMLDocument2

для начала -
http://delphi.vitpc.com/mastering/tweb.htm


 
Master-Igor ©   (2003-04-12 12:05) [6]

Меня етат вапрос тоже интересен:)))) Но уменя ищо вазникаєт, как витащить все URL из страници, где есть скріпти????????????


 
Ihor Osov'yak ©   (2003-04-12 12:39) [7]

2 Master-Igor © (12.04.03 12:05)

Я конечно понимаю, что во Львове русский в школе не изучают, но нужно же меру какую-то иметь, ... с. КЛД..

Пиши лучше на английском..

Зы - однако есть подозрение, что на родном ты не очень то грамотнее..



 
anpsoft   (2003-04-12 13:02) [8]

rjHtmlParser Version 0.1a freeware
Copyright (c) 2000 by Ralf Junker <ralfjunker@gmx.de>.

rjHtmlParser includes three components: THtmlReporter, THtmlWriter, and
THtmlAutoWriter. They allow fast and flexible parsing and writing of HTML files.
Some of their features are:

* Very flexible interface. Read HTML files from any source and write to any
destination by as-signing your own OnReadChar function. The parser will only
read one character at a time, so you can even parse files of unlimited size.

* Advanced filtering options: THtmlReporter and THtmlAutoWriter allow to include
or exclude all 8 elements (ASP, Comments, DTD, Scripts, SSI, Styles, Tags and
Text) into the reporting or auto-writing. Filters for tags can be set for
starttags and endtags separately.

* Proper handling of preformatted text.

* Conversion of HTML character entities.



Страницы: 1 вся ветка

Текущий архив: 2003.05.01;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.01 c
3-443
Lony
2003-04-13 14:00
2003.05.01
Как получить все записи в определёном FieldDefs?


9-371
mad_mike
2002-11-26 17:43
2003.05.01
X под 6


3-456
Tango
2003-04-11 06:29
2003.05.01
Замучала беда с locate


1-572
Дельфятник
2003-04-18 12:02
2003.05.01
Какие события надо ловить чтобы программа реагировала на то, (+)


3-467
msguns
2003-04-10 18:38
2003.05.01
Технология работы с IB/FB