Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Сети";
Текущий архив: 2005.03.27;
Скачать: [xml.tar.bz2];

Вниз

Скачать страницу целиком   Найти похожие ветки 

 
Dimoon2005   (2005-01-22 20:31) [0]

Привет всем!

Подскажите, существует ли что-то, позволяющее скачивать страницу по URL и сохранять на диске? Причем не только сам HTML, но и images, а также CSS, etc?
Конечно, можно сначала скачать саму страницу, парсить ее, потом скачать ее элементы и сохранить на диске в определенных папках...

Но неужели нет чего-либо готового (source, ocx, dll, etc), в т.ч. платного?


 
Dextor ©   (2005-01-22 20:43) [1]

По идее скачать ее мона тока обрабатывая HTML, т.е. сканить все ссылки на имаги и CSS и все такое... Пиши сам, не сложно, подумав, все получится !


 
Anatoly Podgoretsky ©   (2005-01-22 20:45) [2]

А ссылки на другие страницы, их что тоже скачивать?


 
Eraser ©   (2005-01-22 20:55) [3]

Images"ы скачиваются отдельными HTTP запросами.


 
Dimoon2005   (2005-01-22 21:19) [4]

Гемор. Столько нюансов - фреймы, css-ы, разные имиджи, обработка суперсложных ссылок типа http://yandex.ru:9000/i?id=3423&jdh etc...


 
Piter ©   (2005-01-22 21:52) [5]

Internet Explorer умеет полностью загружать страницу + сохранять в .mht файл

Соответственно, смотрим в сторону TWebBrowser


 
Vasya.ru ©   (2005-01-22 22:51) [6]

Piter ©   (22.01.05 21:52) [5]
Вот ты мне скажи - TWEbBrowser"oм можно открыть страницу, и сохранить её на диске/загрузить в мемо. TEmbeddedWebBrowser или как там его не предлагать


 
aus   (2005-01-22 23:28) [7]

Идея:
Word открывает страницу, если "Сохранить как..." doc, все будет в одном файле.


 
Piter ©   (2005-01-23 00:16) [8]

Vasya.ru ©   (22.01.05 22:51) [6]
Вот ты мне скажи - TWEbBrowser"oм можно открыть страницу, и сохранить её на диске


можно

TEmbeddedWebBrowser или как там его не предлагать

почему?


 
Ihor Osov'yak ©   (2005-01-23 00:49) [9]

2 [6] Vasya.ru ©   (22.01.05 22:51)

А в чем принципиальное отличие TWebBrowser и TEmbeddedWB, делающее невозможность использования последнего?

Да, кстати, о птичках.. Не уверен, что TEmbeddedWB сильно облегшает решение поставленой задачи по сравнению с TWebBrowser...


 
Piter ©   (2005-01-23 01:08) [10]

Ihor Osov"yak ©   (23.01.05 0:49) [9]
Не уверен, что TEmbeddedWB сильно облегшает решение поставленой задачи по сравнению с TWebBrowser


да по-моему вообще не облегчает. Там вроде нету функции сохранения в файл без вызова диалогового окна.


 
Dimoon2005   (2005-01-23 02:11) [11]

Имхо, надо искать где-то компонент :(


 
Piter ©   (2005-01-23 02:23) [12]

Гы, ищи

P.S. "А мы пойдем своим путем!"


 
Dimoon2005   (2005-01-23 02:39) [13]

какие например?


 
Piter ©   (2005-01-23 02:52) [14]

Dimoon2005   (23.01.05 2:39) [13]
какие например?


что какие? Компоненты? Откуда я знаю, хочешь искать - ищи.

А я уже сказал, как бы я сделал


 
Dimoon2005   (2005-01-23 02:59) [15]

Попробую...

Скажите, а что значит выражение "сделано на движке IE"? Т.Е. если я хочу использовать движок IE для скачки файлов, какие библиотеки/функции мне надо юзать?


 
Piter ©   (2005-01-23 03:04) [16]

Dimoon2005   (23.01.05 2:59) [15]
Скажите, а что значит выражение "сделано на движке IE"?


а это ты откуда взял?

Компонент TWebBrowser есть на вкладке Internet в Delphi.
Он инкапсулирует движок IE так сказать..

Подробности в интернет


 
Dimoon2005   (2005-01-23 03:08) [17]

Ок, спасибо!!!!!

И последний вопросик...

Загнать в html-документ в парсер я вроде умею, а как его получить _целиком_ в виде текста? :)


 
Piter ©   (2005-01-23 03:08) [18]

Во многих современных программах необходимо работать с данными в формате HTML. В качестве средства для просмотра таких данных в Delphi применяется компонент TWebBrowser, который использует элемент управления ActiveX WebBrowser, входящий в состав Microsoft Internet Explorer. Таким образом, этот компонент имеется на любом компьютере, на котором установлен Internet Explorer. Все последние версии Windows содержат TWebBrowser в своем составе и без него практически неработоспособны

(c) Анатолий Тенцер


 
Dimoon2005   (2005-01-23 03:14) [19]

круто....


 
Cobalt ©   (2005-01-23 03:18) [20]

2 Dimoon2005   (23.01.05 03:08) [17]
Ты его, пардон, в каком виде загоняешь? В бинарном, что ли?


 
Dimoon2005   (2005-01-23 03:21) [21]

нет, текст :) загоняю, а вытащить целиком (с title, head) не умею :(


 
Dimoon2005   (2005-01-23 03:44) [22]

фишка такая: читаю html-файл, загоняю в парсер, при помощи которого делаю в этом файле кое-какие изменения.

как теперь сохранить результат?


 
Cobalt ©   (2005-01-23 11:44) [23]

У этого парсера что, нету какого-нить св-ва типа Text али Strings?


 
Dimoon2005   (2005-01-23 12:44) [24]

незнаю. я юзаю MS HTML parser (он же webbrowser)


 
Piter ©   (2005-01-23 15:27) [25]

Dimoon2005   (23.01.05 12:44) [24]

ты что-то не то говоришь. Приводи код, в котором что-то не получается и пиши, что конкретно не получается и что нужно


 
Dimoon2005   (2005-01-23 15:49) [26]

Понимаете, код то на Visual Basic. Но тем не менее.

dim doc as ihtmldocument2
set doc=new htmldocument
doc.body.innerHTML="<html><head><title></title></head></html>"

вот так загружаю. а как теперь обратно его получить?

используется MSHTML Object Library (mshtml.tlb)


 
Piter ©   (2005-01-23 17:32) [27]

если код на VB - что же ты на Delphimaster делаешь? :)


 
Dimoon2005   (2005-01-23 19:40) [28]

я ищу везде!
ну неужели это невозможно? имхо, это совсем не сложно... может я неправильно ставлю вопрос?


 
Dimoon2005   (2005-01-23 23:07) [29]

Ура, я узнал! На VB это выглядит так.

Dim doc As IHTMLDocument2
Set doc = New HTMLDocument

doc.body.document.write "<html><head><title>1</title></head><body>2</body></html>"
Print doc.body.document.documentElement.outerHTML



Страницы: 1 вся ветка

Форум: "Сети";
Текущий архив: 2005.03.27;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.51 MB
Время: 0.667 c
14-1109856022
saNat
2005-03-03 16:20
2005.03.27
Помогите найти сервер для ICQ


1-1111003462
aLexx25
2005-03-16 23:04
2005.03.27
ПОМОГИТЕ с мышью (как обработать нажатие двух кнопок.)


14-1110203727
Ломброзо
2005-03-07 16:55
2005.03.27
По просьбам трудящихся!


14-1109944753
1008
2005-03-04 16:59
2005.03.27
Интересный глюк


1-1110439516
Эли
2005-03-10 10:25
2005.03.27
Чтобы можно было увидеть русские шрифты





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский