Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2003.05.01;
Скачать: CL | DM;

Вниз

Есть ли где парсер для HTML?   Найти похожие ветки 

 
Lin   (2003-04-11 11:30) [0]

ПОдскажите, хочу парсить html и в зависимоти от тагов выполнять определенные действия с текстом. Где можно посмотреть алгоритмы или исходники.


 
malkolinge ©   (2003-04-11 11:44) [1]

самому думать и про строковые функции читать


 
panov ©   (2003-04-11 12:44) [2]

Попробуй в инете поискать...


 
Дмитрий К.К. ©   (2003-04-11 13:07) [3]

На Торри видал такой. Весьма мощный.


 
nikkie ©   (2003-04-11 13:13) [4]

см. MSDN на тему IHTMLDocument2
можно маленький пример посмотреть здесь:
http://www.codeguru.com/ieprogram/HTMLParsing.html

только имхо, там совершенно зря IMarkupServices используются - они требуют IE5, для парсинга вполне хватит IHTMLTxtRange и IHTMLElement - для них хватает IE4.


 
Ihor Osov'yak ©   (2003-04-11 14:12) [5]

MSDN - Reusing Browser Technology.
grouts/google.com - Поиск по ключевым словам
delphi mshtml IHTMLElement IHTMLDocument2

для начала -
http://delphi.vitpc.com/mastering/tweb.htm


 
Master-Igor ©   (2003-04-12 12:05) [6]

Меня етат вапрос тоже интересен:)))) Но уменя ищо вазникаєт, как витащить все URL из страници, где есть скріпти????????????


 
Ihor Osov'yak ©   (2003-04-12 12:39) [7]

2 Master-Igor © (12.04.03 12:05)

Я конечно понимаю, что во Львове русский в школе не изучают, но нужно же меру какую-то иметь, ... с. КЛД..

Пиши лучше на английском..

Зы - однако есть подозрение, что на родном ты не очень то грамотнее..



 
anpsoft   (2003-04-12 13:02) [8]

rjHtmlParser Version 0.1a freeware
Copyright (c) 2000 by Ralf Junker <ralfjunker@gmx.de>.

rjHtmlParser includes three components: THtmlReporter, THtmlWriter, and
THtmlAutoWriter. They allow fast and flexible parsing and writing of HTML files.
Some of their features are:

* Very flexible interface. Read HTML files from any source and write to any
destination by as-signing your own OnReadChar function. The parser will only
read one character at a time, so you can even parse files of unlimited size.

* Advanced filtering options: THtmlReporter and THtmlAutoWriter allow to include
or exclude all 8 elements (ASP, Comments, DTD, Scripts, SSI, Styles, Tags and
Text) into the reporting or auto-writing. Filters for tags can be set for
starttags and endtags separately.

* Proper handling of preformatted text.

* Conversion of HTML character entities.



Страницы: 1 вся ветка

Текущий архив: 2003.05.01;
Скачать: CL | DM;

Наверх




Память: 0.48 MB
Время: 0.013 c
3-487
Wedos
2003-04-15 06:10
2003.05.01
Проблема с DbChart


1-605
Filat
2003-04-18 16:27
2003.05.01
Не получается расставить Anchrs :(((((


3-431
gary5555
2003-04-12 15:25
2003.05.01
Как сделать неизменной нумерацию строк???


1-641
did
2003-04-17 15:46
2003.05.01
Компонент для Просмотров файлов word


14-762
NetBreaker666
2003-04-12 17:54
2003.05.01
Создание экземпляра класса по имени класса.