Форум: "Сети";
Текущий архив: 2005.03.27;
Скачать: [xml.tar.bz2];
ВнизСкачать страницу целиком Найти похожие ветки
← →
Dimoon2005 (2005-01-22 20:31) [0]Привет всем!
Подскажите, существует ли что-то, позволяющее скачивать страницу по URL и сохранять на диске? Причем не только сам HTML, но и images, а также CSS, etc?
Конечно, можно сначала скачать саму страницу, парсить ее, потом скачать ее элементы и сохранить на диске в определенных папках...
Но неужели нет чего-либо готового (source, ocx, dll, etc), в т.ч. платного?
← →
Dextor © (2005-01-22 20:43) [1]По идее скачать ее мона тока обрабатывая HTML, т.е. сканить все ссылки на имаги и CSS и все такое... Пиши сам, не сложно, подумав, все получится !
← →
Anatoly Podgoretsky © (2005-01-22 20:45) [2]А ссылки на другие страницы, их что тоже скачивать?
← →
Eraser © (2005-01-22 20:55) [3]Images"ы скачиваются отдельными HTTP запросами.
← →
Dimoon2005 (2005-01-22 21:19) [4]Гемор. Столько нюансов - фреймы, css-ы, разные имиджи, обработка суперсложных ссылок типа http://yandex.ru:9000/i?id=3423&jdh etc...
← →
Piter © (2005-01-22 21:52) [5]Internet Explorer умеет полностью загружать страницу + сохранять в .mht файл
Соответственно, смотрим в сторону TWebBrowser
← →
Vasya.ru © (2005-01-22 22:51) [6]Piter © (22.01.05 21:52) [5]
Вот ты мне скажи - TWEbBrowser"oм можно открыть страницу, и сохранить её на диске/загрузить в мемо. TEmbeddedWebBrowser или как там его не предлагать
← →
aus (2005-01-22 23:28) [7]Идея:
Word открывает страницу, если "Сохранить как..." doc, все будет в одном файле.
← →
Piter © (2005-01-23 00:16) [8]Vasya.ru © (22.01.05 22:51) [6]
Вот ты мне скажи - TWEbBrowser"oм можно открыть страницу, и сохранить её на диске
можно
TEmbeddedWebBrowser или как там его не предлагать
почему?
← →
Ihor Osov'yak © (2005-01-23 00:49) [9]2 [6] Vasya.ru © (22.01.05 22:51)
А в чем принципиальное отличие TWebBrowser и TEmbeddedWB, делающее невозможность использования последнего?
Да, кстати, о птичках.. Не уверен, что TEmbeddedWB сильно облегшает решение поставленой задачи по сравнению с TWebBrowser...
← →
Piter © (2005-01-23 01:08) [10]Ihor Osov"yak © (23.01.05 0:49) [9]
Не уверен, что TEmbeddedWB сильно облегшает решение поставленой задачи по сравнению с TWebBrowser
да по-моему вообще не облегчает. Там вроде нету функции сохранения в файл без вызова диалогового окна.
← →
Dimoon2005 (2005-01-23 02:11) [11]Имхо, надо искать где-то компонент :(
← →
Piter © (2005-01-23 02:23) [12]Гы, ищи
P.S. "А мы пойдем своим путем!"
← →
Dimoon2005 (2005-01-23 02:39) [13]какие например?
← →
Piter © (2005-01-23 02:52) [14]Dimoon2005 (23.01.05 2:39) [13]
какие например?
что какие? Компоненты? Откуда я знаю, хочешь искать - ищи.
А я уже сказал, как бы я сделал
← →
Dimoon2005 (2005-01-23 02:59) [15]Попробую...
Скажите, а что значит выражение "сделано на движке IE"? Т.Е. если я хочу использовать движок IE для скачки файлов, какие библиотеки/функции мне надо юзать?
← →
Piter © (2005-01-23 03:04) [16]Dimoon2005 (23.01.05 2:59) [15]
Скажите, а что значит выражение "сделано на движке IE"?
а это ты откуда взял?
Компонент TWebBrowser есть на вкладке Internet в Delphi.
Он инкапсулирует движок IE так сказать..
Подробности в интернет
← →
Dimoon2005 (2005-01-23 03:08) [17]Ок, спасибо!!!!!
И последний вопросик...
Загнать в html-документ в парсер я вроде умею, а как его получить _целиком_ в виде текста? :)
← →
Piter © (2005-01-23 03:08) [18]Во многих современных программах необходимо работать с данными в формате HTML. В качестве средства для просмотра таких данных в Delphi применяется компонент TWebBrowser, который использует элемент управления ActiveX WebBrowser, входящий в состав Microsoft Internet Explorer. Таким образом, этот компонент имеется на любом компьютере, на котором установлен Internet Explorer. Все последние версии Windows содержат TWebBrowser в своем составе и без него практически неработоспособны
(c) Анатолий Тенцер
← →
Dimoon2005 (2005-01-23 03:14) [19]круто....
← →
Cobalt © (2005-01-23 03:18) [20]2 Dimoon2005 (23.01.05 03:08) [17]
Ты его, пардон, в каком виде загоняешь? В бинарном, что ли?
← →
Dimoon2005 (2005-01-23 03:21) [21]нет, текст :) загоняю, а вытащить целиком (с title, head) не умею :(
← →
Dimoon2005 (2005-01-23 03:44) [22]фишка такая: читаю html-файл, загоняю в парсер, при помощи которого делаю в этом файле кое-какие изменения.
как теперь сохранить результат?
← →
Cobalt © (2005-01-23 11:44) [23]У этого парсера что, нету какого-нить св-ва типа Text али Strings?
← →
Dimoon2005 (2005-01-23 12:44) [24]незнаю. я юзаю MS HTML parser (он же webbrowser)
← →
Piter © (2005-01-23 15:27) [25]Dimoon2005 (23.01.05 12:44) [24]
ты что-то не то говоришь. Приводи код, в котором что-то не получается и пиши, что конкретно не получается и что нужно
← →
Dimoon2005 (2005-01-23 15:49) [26]Понимаете, код то на Visual Basic. Но тем не менее.
dim doc as ihtmldocument2
set doc=new htmldocument
doc.body.innerHTML="<html><head><title></title></head></html>"
вот так загружаю. а как теперь обратно его получить?
используется MSHTML Object Library (mshtml.tlb)
← →
Piter © (2005-01-23 17:32) [27]если код на VB - что же ты на Delphimaster делаешь? :)
← →
Dimoon2005 (2005-01-23 19:40) [28]я ищу везде!
ну неужели это невозможно? имхо, это совсем не сложно... может я неправильно ставлю вопрос?
← →
Dimoon2005 (2005-01-23 23:07) [29]Ура, я узнал! На VB это выглядит так.
Dim doc As IHTMLDocument2
Set doc = New HTMLDocument
doc.body.document.write "<html><head><title>1</title></head><body>2</body></html>"
Print doc.body.document.documentElement.outerHTML
Страницы: 1 вся ветка
Форум: "Сети";
Текущий архив: 2005.03.27;
Скачать: [xml.tar.bz2];
Память: 0.51 MB
Время: 0.042 c