Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2007.06.10;
Скачать: CL | DM;

Вниз

Подскажите: как это организовать скачивание?   Найти похожие ветки 

 
vasIZmax ©   (2007-05-11 02:14) [0]

В общем такая вот затея (может быть она уже реализована?).
С одного сайта мне надо скачать несколько (точнее много:-)) файлов.
Путь к файлам выглядит таким образом:

Страница_список_файлов\Страница_файл_№*_с_описанием\файл_№*.zip

как можно не открывая "Страница_файл_№*_с_описанием" скачать файл_№*.zip?

Задача была бы простой если у бы файлы качались по id какому-нибудь (как у библиотеки Ихтика к примеру, номер просто меняешь и все), но "заморочка" в том что у зипиков названия уникальные в том плане цифирки поменяв все-равно не скачаешь файл:(.

Зачем это нужно? Да просто на "Страница_файл_№*_с_описанием" много всякой "ерунды", и мне надо ее всю загружать, ради одной только ссылки((.

Как можно реализовать такой вот обход?

ЗЫ. Надеюсь, это не посчитается взлом или чем то подобным, сейчас экономия просто суровая, а файлики надо:)


 
Knight ©   (2007-05-11 08:14) [1]

Есть какая-то прога, что-то со словом Pump...


 
db2admin   (2007-05-11 11:19) [2]

прога getRight?


 
ПЛОВ ©   (2007-05-11 13:54) [3]

Вроде есть проги для выкачки целиком сайтов, и там можно задавать какие именно файлы скачивать (хтмл, картинки, архивы).


 
homm ©   (2007-05-11 13:58) [4]

> и там можно задавать какие именно файлы скачивать (хтмл,
> картинки, архивы).

Интересно, как ты закачаешь картинки, не закачав HTML? :)


 
ПЛОВ ©   (2007-05-11 14:03) [5]


> homm ©   (11.05.07 13:58) [4]

Я имел в виду что можно качать только хтмл или вместе с другими файлами, или качать хтмл а сохранять только, например, архивы. Без хтмл-а конечно никуда :)


 
StriderMan ©   (2007-05-11 15:53) [6]

давным давно была прога для закачки сайтов целиком, TELEPORT кажись называлась.


 
vasIZmax ©   (2007-05-12 23:50) [7]

По пробовал целиком скачать сайт....
Использовал WebCopier(этим пользовался, вполне нормально всегда проходило скачивание) и MetaProducts Offline Explorer Enterprise (эту первый раз юзал)... Не выходит, выдает ошибку

Ошибка (HTTP код 503) - "http://www.*****.***/books.htm"
Загрузка завершена (23:40:42, Май 12, 2007)


Может какой еще может быть способ?

Вот полный путь к файлу
1)http://www.********.***/?books_best&group=11
2)http://www.********.***/?getbook&id=4309&type=txt
3)http://files.ru.********.***/data/bookcatalog/Tolstoy_Lev/L.Tolstoy%20-%20Ispoved".zip

Вот как попасть с 1 ссылки на 3, или хотя бы ограничить загрузку 2 (т.е. получить только ссылку на 3 и все).

Может просто это не решаемая задачка(в настоящее время)?

ЗЫ. Звезды стоят что бы ветка не носила рекламного характера!


 
Vendict ©   (2007-05-13 13:49) [8]

в одной из страниц(а может и в обоих) наверняка стоит редирект посредством html:
<META http-equiv="refresh" content="4;URL=http://длинный_путь_к_файлу.zip">
так вот можно до этого редиректа и подгружать а потом смотреть ссылку, на какую он ссылается и скачивать файл.


 
isasa ©   (2007-05-13 15:11) [9]

Скорее всего, страница, и, соответственно, ссылки, формируются динамически. (http:_//www.********.***/?books_best&group=11)
Так же динамически формируентся и ссылочный контент, соответствующий высылаемому пользователю образу html страницы.
Нада писать парсер страницы, высылаемой по запросу http:_//www.********.***/?books_best&group=11
с закачкой ссылок.
+ У ссылочного контента, скорее всего, ограниченое "время жизни"


 
isasa ©   (2007-05-13 15:14) [10]

Не видно .../?... - выделил жирным. Там или *.dll, или *.aspx в общем, что-то из серии Server Side.


 
homm ©   (2007-05-13 15:18) [11]

>Там или *.dll, или *.aspx
> в общем, что-то из серии Server Side.

Что в общем случае ниска не влияет на то, откуда ты вызываешь этот адресс. Дело может быть либо в куках, либо в какой-то защите «от дурака» вот для таково скачивания.


 
Сатир   (2007-05-13 15:23) [12]

TPro.exe


 
isasa ©   (2007-05-13 15:23) [13]

homm ©   (13.05.07 15:18) [11]
Что в общем случае ниска не влияет на то, откуда ты вызываешь этот адресс.

Да ради Бога. Новый сеанс - новые ссылки ...


 
isasa ©   (2007-05-13 15:27) [14]

Да, вопрос. А файлы
http:_//files.ru.********.***/data/bookcatalog/Tolstoy_Lev/L.Tolstoy%20-%20Ispoved".zip
качаются без проблем?


 
vasIZmax ©   (2007-05-13 17:39) [15]


> isasa ©   (13.05.07 15:27) [14]

Да, качается без проблем.
Хоть я их и скачал "по одиночке" файлы, но все же интересно как можно выйти из ситуации на будующее, мало ли чего прийдется качать.

Порекомендовали wget. Сейчас разбираюсь вот.


> Сатир   (13.05.07 15:23) [12]
> TPro.exe

Чего-то поисковики всякую ахинею выдают по запросу.


 
VirEx ©   (2007-05-13 18:12) [16]

offline explorer,русский интерфейс, бесплатный, качай хоть весь сайт, хоть по фильтрам


 
Сатир   (2007-05-13 18:53) [17]


> TPro.exe

Так это же приблуда для скачивания сайтов, называется TeleportPro, задаёшь начальную страницу, глубину скачивания, какие файлы скачивать, фильтры на линки и т.д. и т.п.
Оч. удобно.


 
vasIZmax ©   (2007-05-13 19:23) [18]


> Сатир   (13.05.07 18:53) [17]

... TeleportPro.... (хотя и говорилось о ней в [6])

В самом деле начал чего-то качать))), а потом появилось сообщение:

Ваш IP адрес заблокирован. Страницы сайта для Вас отдаваться не будут.
Доступ к сайту для программ рекурсивной закачки закрыт,
либо ваш компьютер запросил чрезвычайно большое количество
страниц с нашего сервера за короткое время.
Если это ошибочно - возвращайтесь на сайт через пару часов, ситуацию поправим.


Что ж подождем пару часиков:).

Всем спасибо за оказанную помощь)))



Страницы: 1 вся ветка

Текущий архив: 2007.06.10;
Скачать: CL | DM;

Наверх




Память: 0.51 MB
Время: 0.262 c
2-1179826215
pohil
2007-05-22 13:30
2007.06.10
Flash и Dephi


15-1179253032
N3xt_
2007-05-15 22:17
2007.06.10
Программа


2-1179393412
Kolan
2007-05-17 13:16
2007.06.10
Никогда не делал отчёт, как это делать.


15-1179317312
ArtemESC
2007-05-16 16:08
2007.06.10
На каком языке мыслите вы?


2-1179413482
Qazxswedc1
2007-05-17 18:51
2007.06.10
поиск файлов на локальном диске