Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2003.05.01;
Скачать: [xml.tar.bz2];

Вниз

Есть ли где парсер для HTML?   Найти похожие ветки 

 
Lin   (2003-04-11 11:30) [0]

ПОдскажите, хочу парсить html и в зависимоти от тагов выполнять определенные действия с текстом. Где можно посмотреть алгоритмы или исходники.


 
malkolinge   (2003-04-11 11:44) [1]

самому думать и про строковые функции читать


 
panov   (2003-04-11 12:44) [2]

Попробуй в инете поискать...


 
Дмитрий К.К.   (2003-04-11 13:07) [3]

На Торри видал такой. Весьма мощный.


 
nikkie   (2003-04-11 13:13) [4]

см. MSDN на тему IHTMLDocument2
можно маленький пример посмотреть здесь:
http://www.codeguru.com/ieprogram/HTMLParsing.html

только имхо, там совершенно зря IMarkupServices используются - они требуют IE5, для парсинга вполне хватит IHTMLTxtRange и IHTMLElement - для них хватает IE4.


 
Ihor Osov'yak   (2003-04-11 14:12) [5]

MSDN - Reusing Browser Technology.
grouts/google.com - Поиск по ключевым словам
delphi mshtml IHTMLElement IHTMLDocument2

для начала -
http://delphi.vitpc.com/mastering/tweb.htm


 
Master-Igor   (2003-04-12 12:05) [6]

Меня етат вапрос тоже интересен:)))) Но уменя ищо вазникаєт, как витащить все URL из страници, где есть скріпти????????????


 
Ihor Osov'yak   (2003-04-12 12:39) [7]

2 Master-Igor © (12.04.03 12:05)

Я конечно понимаю, что во Львове русский в школе не изучают, но нужно же меру какую-то иметь, ... с. КЛД..

Пиши лучше на английском..

Зы - однако есть подозрение, что на родном ты не очень то грамотнее..



 
anpsoft   (2003-04-12 13:02) [8]

rjHtmlParser Version 0.1a freeware
Copyright (c) 2000 by Ralf Junker <ralfjunker@gmx.de>.

rjHtmlParser includes three components: THtmlReporter, THtmlWriter, and
THtmlAutoWriter. They allow fast and flexible parsing and writing of HTML files.
Some of their features are:

* Very flexible interface. Read HTML files from any source and write to any
destination by as-signing your own OnReadChar function. The parser will only
read one character at a time, so you can even parse files of unlimited size.

* Advanced filtering options: THtmlReporter and THtmlAutoWriter allow to include
or exclude all 8 elements (ASP, Comments, DTD, Scripts, SSI, Styles, Tags and
Text) into the reporting or auto-writing. Filters for tags can be set for
starttags and endtags separately.

* Proper handling of preformatted text.

* Conversion of HTML character entities.



Страницы: 1 вся ветка

Форум: "Потрепаться";
Текущий архив: 2003.05.01;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.46 MB
Время: 0.007 c
1-563
Sirus
2003-04-16 12:18
2003.05.01
Как определить файл типа запись???


3-443
Lony
2003-04-13 14:00
2003.05.01
Как получить все записи в определёном FieldDefs?


1-578
Leo-pro
2003-04-18 11:20
2003.05.01
Форма


14-777
Sergo
2003-04-15 11:21
2003.05.01
BIOS


14-696
iNew
2003-04-12 07:28
2003.05.01
Где можно скачать установщик с набором наиболее используемых





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский