Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.05.01;
Скачать: CL | DM;

Вниз

Есть ли где парсер для HTML?   Найти похожие ветки 

 
Lin   (2003-04-11 11:30) [0]

ПОдскажите, хочу парсить html и в зависимоти от тагов выполнять определенные действия с текстом. Где можно посмотреть алгоритмы или исходники.


 
malkolinge ©   (2003-04-11 11:44) [1]

самому думать и про строковые функции читать


 
panov ©   (2003-04-11 12:44) [2]

Попробуй в инете поискать...


 
Дмитрий К.К. ©   (2003-04-11 13:07) [3]

На Торри видал такой. Весьма мощный.


 
nikkie ©   (2003-04-11 13:13) [4]

см. MSDN на тему IHTMLDocument2
можно маленький пример посмотреть здесь:
http://www.codeguru.com/ieprogram/HTMLParsing.html

только имхо, там совершенно зря IMarkupServices используются - они требуют IE5, для парсинга вполне хватит IHTMLTxtRange и IHTMLElement - для них хватает IE4.


 
Ihor Osov'yak ©   (2003-04-11 14:12) [5]

MSDN - Reusing Browser Technology.
grouts/google.com - Поиск по ключевым словам
delphi mshtml IHTMLElement IHTMLDocument2

для начала -
http://delphi.vitpc.com/mastering/tweb.htm


 
Master-Igor ©   (2003-04-12 12:05) [6]

Меня етат вапрос тоже интересен:)))) Но уменя ищо вазникаєт, как витащить все URL из страници, где есть скріпти????????????


 
Ihor Osov'yak ©   (2003-04-12 12:39) [7]

2 Master-Igor © (12.04.03 12:05)

Я конечно понимаю, что во Львове русский в школе не изучают, но нужно же меру какую-то иметь, ... с. КЛД..

Пиши лучше на английском..

Зы - однако есть подозрение, что на родном ты не очень то грамотнее..



 
anpsoft   (2003-04-12 13:02) [8]

rjHtmlParser Version 0.1a freeware
Copyright (c) 2000 by Ralf Junker <ralfjunker@gmx.de>.

rjHtmlParser includes three components: THtmlReporter, THtmlWriter, and
THtmlAutoWriter. They allow fast and flexible parsing and writing of HTML files.
Some of their features are:

* Very flexible interface. Read HTML files from any source and write to any
destination by as-signing your own OnReadChar function. The parser will only
read one character at a time, so you can even parse files of unlimited size.

* Advanced filtering options: THtmlReporter and THtmlAutoWriter allow to include
or exclude all 8 elements (ASP, Comments, DTD, Scripts, SSI, Styles, Tags and
Text) into the reporting or auto-writing. Filters for tags can be set for
starttags and endtags separately.

* Proper handling of preformatted text.

* Conversion of HTML character entities.



Страницы: 1 вся ветка

Текущий архив: 2003.05.01;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.01 c
1-620
NikB
2003-04-19 00:09
2003.05.01
TForm. Помогите пожалуйста в устранение ошибку онаследения tForm!


3-457
Desperado
2003-04-14 09:22
2003.05.01
массивы в IB


14-733
Дмитрий К.К.
2003-04-14 07:31
2003.05.01
Именинники 12 апреля


1-524
ZATISHYA
2003-04-19 02:03
2003.05.01
ПОМОГИТЕ!!! Как сделать перекодировщик символов по таблице???????


1-621
tytus
2003-04-19 10:33
2003.05.01
button