Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2005.03.27;
Скачать: CL | DM;

Вниз

Скачать страницу целиком   Найти похожие ветки 

 
Dimoon2005   (2005-01-22 20:31) [0]

Привет всем!

Подскажите, существует ли что-то, позволяющее скачивать страницу по URL и сохранять на диске? Причем не только сам HTML, но и images, а также CSS, etc?
Конечно, можно сначала скачать саму страницу, парсить ее, потом скачать ее элементы и сохранить на диске в определенных папках...

Но неужели нет чего-либо готового (source, ocx, dll, etc), в т.ч. платного?


 
Dextor ©   (2005-01-22 20:43) [1]

По идее скачать ее мона тока обрабатывая HTML, т.е. сканить все ссылки на имаги и CSS и все такое... Пиши сам, не сложно, подумав, все получится !


 
Anatoly Podgoretsky ©   (2005-01-22 20:45) [2]

А ссылки на другие страницы, их что тоже скачивать?


 
Eraser ©   (2005-01-22 20:55) [3]

Images"ы скачиваются отдельными HTTP запросами.


 
Dimoon2005   (2005-01-22 21:19) [4]

Гемор. Столько нюансов - фреймы, css-ы, разные имиджи, обработка суперсложных ссылок типа http://yandex.ru:9000/i?id=3423&jdh etc...


 
Piter ©   (2005-01-22 21:52) [5]

Internet Explorer умеет полностью загружать страницу + сохранять в .mht файл

Соответственно, смотрим в сторону TWebBrowser


 
Vasya.ru ©   (2005-01-22 22:51) [6]

Piter ©   (22.01.05 21:52) [5]
Вот ты мне скажи - TWEbBrowser"oм можно открыть страницу, и сохранить её на диске/загрузить в мемо. TEmbeddedWebBrowser или как там его не предлагать


 
aus   (2005-01-22 23:28) [7]

Идея:
Word открывает страницу, если "Сохранить как..." doc, все будет в одном файле.


 
Piter ©   (2005-01-23 00:16) [8]

Vasya.ru ©   (22.01.05 22:51) [6]
Вот ты мне скажи - TWEbBrowser"oм можно открыть страницу, и сохранить её на диске


можно

TEmbeddedWebBrowser или как там его не предлагать

почему?


 
Ihor Osov'yak ©   (2005-01-23 00:49) [9]

2 [6] Vasya.ru ©   (22.01.05 22:51)

А в чем принципиальное отличие TWebBrowser и TEmbeddedWB, делающее невозможность использования последнего?

Да, кстати, о птичках.. Не уверен, что TEmbeddedWB сильно облегшает решение поставленой задачи по сравнению с TWebBrowser...


 
Piter ©   (2005-01-23 01:08) [10]

Ihor Osov"yak ©   (23.01.05 0:49) [9]
Не уверен, что TEmbeddedWB сильно облегшает решение поставленой задачи по сравнению с TWebBrowser


да по-моему вообще не облегчает. Там вроде нету функции сохранения в файл без вызова диалогового окна.


 
Dimoon2005   (2005-01-23 02:11) [11]

Имхо, надо искать где-то компонент :(


 
Piter ©   (2005-01-23 02:23) [12]

Гы, ищи

P.S. "А мы пойдем своим путем!"


 
Dimoon2005   (2005-01-23 02:39) [13]

какие например?


 
Piter ©   (2005-01-23 02:52) [14]

Dimoon2005   (23.01.05 2:39) [13]
какие например?


что какие? Компоненты? Откуда я знаю, хочешь искать - ищи.

А я уже сказал, как бы я сделал


 
Dimoon2005   (2005-01-23 02:59) [15]

Попробую...

Скажите, а что значит выражение "сделано на движке IE"? Т.Е. если я хочу использовать движок IE для скачки файлов, какие библиотеки/функции мне надо юзать?


 
Piter ©   (2005-01-23 03:04) [16]

Dimoon2005   (23.01.05 2:59) [15]
Скажите, а что значит выражение "сделано на движке IE"?


а это ты откуда взял?

Компонент TWebBrowser есть на вкладке Internet в Delphi.
Он инкапсулирует движок IE так сказать..

Подробности в интернет


 
Dimoon2005   (2005-01-23 03:08) [17]

Ок, спасибо!!!!!

И последний вопросик...

Загнать в html-документ в парсер я вроде умею, а как его получить _целиком_ в виде текста? :)


 
Piter ©   (2005-01-23 03:08) [18]

Во многих современных программах необходимо работать с данными в формате HTML. В качестве средства для просмотра таких данных в Delphi применяется компонент TWebBrowser, который использует элемент управления ActiveX WebBrowser, входящий в состав Microsoft Internet Explorer. Таким образом, этот компонент имеется на любом компьютере, на котором установлен Internet Explorer. Все последние версии Windows содержат TWebBrowser в своем составе и без него практически неработоспособны

(c) Анатолий Тенцер


 
Dimoon2005   (2005-01-23 03:14) [19]

круто....


 
Cobalt ©   (2005-01-23 03:18) [20]

2 Dimoon2005   (23.01.05 03:08) [17]
Ты его, пардон, в каком виде загоняешь? В бинарном, что ли?


 
Dimoon2005   (2005-01-23 03:21) [21]

нет, текст :) загоняю, а вытащить целиком (с title, head) не умею :(


 
Dimoon2005   (2005-01-23 03:44) [22]

фишка такая: читаю html-файл, загоняю в парсер, при помощи которого делаю в этом файле кое-какие изменения.

как теперь сохранить результат?


 
Cobalt ©   (2005-01-23 11:44) [23]

У этого парсера что, нету какого-нить св-ва типа Text али Strings?


 
Dimoon2005   (2005-01-23 12:44) [24]

незнаю. я юзаю MS HTML parser (он же webbrowser)


 
Piter ©   (2005-01-23 15:27) [25]

Dimoon2005   (23.01.05 12:44) [24]

ты что-то не то говоришь. Приводи код, в котором что-то не получается и пиши, что конкретно не получается и что нужно


 
Dimoon2005   (2005-01-23 15:49) [26]

Понимаете, код то на Visual Basic. Но тем не менее.

dim doc as ihtmldocument2
set doc=new htmldocument
doc.body.innerHTML="<html><head><title></title></head></html>"

вот так загружаю. а как теперь обратно его получить?

используется MSHTML Object Library (mshtml.tlb)


 
Piter ©   (2005-01-23 17:32) [27]

если код на VB - что же ты на Delphimaster делаешь? :)


 
Dimoon2005   (2005-01-23 19:40) [28]

я ищу везде!
ну неужели это невозможно? имхо, это совсем не сложно... может я неправильно ставлю вопрос?


 
Dimoon2005   (2005-01-23 23:07) [29]

Ура, я узнал! На VB это выглядит так.

Dim doc As IHTMLDocument2
Set doc = New HTMLDocument

doc.body.document.write "<html><head><title>1</title></head><body>2</body></html>"
Print doc.body.document.documentElement.outerHTML



Страницы: 1 вся ветка

Текущий архив: 2005.03.27;
Скачать: CL | DM;

Наверх




Память: 0.53 MB
Время: 0.024 c
3-1109682373
Mishenka
2005-03-01 16:06
2005.03.27
Как узнать индекс выделенной строки в DBGrid?


3-1109245156
_1
2005-02-24 14:39
2005.03.27
Проблема со вставкой данных в базу (dbExpress)


6-1106505963
Iron Man
2005-01-23 21:46
2005.03.27
Имя компьютера и уникальность в сети.


14-1110270172
AlterEgo of WondeRu
2005-03-08 11:22
2005.03.27
Замятин "МЫ"


1-1110630898
X-Disa
2005-03-12 15:34
2005.03.27
Динамически создать форму