Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2007.06.10;
Скачать: [xml.tar.bz2];

Вниз

Подскажите: как это организовать скачивание?   Найти похожие ветки 

 
vasIZmax ©   (2007-05-11 02:14) [0]

В общем такая вот затея (может быть она уже реализована?).
С одного сайта мне надо скачать несколько (точнее много:-)) файлов.
Путь к файлам выглядит таким образом:

Страница_список_файлов\Страница_файл_№*_с_описанием\файл_№*.zip

как можно не открывая "Страница_файл_№*_с_описанием" скачать файл_№*.zip?

Задача была бы простой если у бы файлы качались по id какому-нибудь (как у библиотеки Ихтика к примеру, номер просто меняешь и все), но "заморочка" в том что у зипиков названия уникальные в том плане цифирки поменяв все-равно не скачаешь файл:(.

Зачем это нужно? Да просто на "Страница_файл_№*_с_описанием" много всякой "ерунды", и мне надо ее всю загружать, ради одной только ссылки((.

Как можно реализовать такой вот обход?

ЗЫ. Надеюсь, это не посчитается взлом или чем то подобным, сейчас экономия просто суровая, а файлики надо:)


 
Knight ©   (2007-05-11 08:14) [1]

Есть какая-то прога, что-то со словом Pump...


 
db2admin   (2007-05-11 11:19) [2]

прога getRight?


 
ПЛОВ ©   (2007-05-11 13:54) [3]

Вроде есть проги для выкачки целиком сайтов, и там можно задавать какие именно файлы скачивать (хтмл, картинки, архивы).


 
homm ©   (2007-05-11 13:58) [4]

> и там можно задавать какие именно файлы скачивать (хтмл,
> картинки, архивы).

Интересно, как ты закачаешь картинки, не закачав HTML? :)


 
ПЛОВ ©   (2007-05-11 14:03) [5]


> homm ©   (11.05.07 13:58) [4]

Я имел в виду что можно качать только хтмл или вместе с другими файлами, или качать хтмл а сохранять только, например, архивы. Без хтмл-а конечно никуда :)


 
StriderMan ©   (2007-05-11 15:53) [6]

давным давно была прога для закачки сайтов целиком, TELEPORT кажись называлась.


 
vasIZmax ©   (2007-05-12 23:50) [7]

По пробовал целиком скачать сайт....
Использовал WebCopier(этим пользовался, вполне нормально всегда проходило скачивание) и MetaProducts Offline Explorer Enterprise (эту первый раз юзал)... Не выходит, выдает ошибку

Ошибка (HTTP код 503) - "http://www.*****.***/books.htm"
Загрузка завершена (23:40:42, Май 12, 2007)


Может какой еще может быть способ?

Вот полный путь к файлу
1)http://www.********.***/?books_best&group=11
2)http://www.********.***/?getbook&id=4309&type=txt
3)http://files.ru.********.***/data/bookcatalog/Tolstoy_Lev/L.Tolstoy%20-%20Ispoved".zip

Вот как попасть с 1 ссылки на 3, или хотя бы ограничить загрузку 2 (т.е. получить только ссылку на 3 и все).

Может просто это не решаемая задачка(в настоящее время)?

ЗЫ. Звезды стоят что бы ветка не носила рекламного характера!


 
Vendict ©   (2007-05-13 13:49) [8]

в одной из страниц(а может и в обоих) наверняка стоит редирект посредством html:
<META http-equiv="refresh" content="4;URL=http://длинный_путь_к_файлу.zip">
так вот можно до этого редиректа и подгружать а потом смотреть ссылку, на какую он ссылается и скачивать файл.


 
isasa ©   (2007-05-13 15:11) [9]

Скорее всего, страница, и, соответственно, ссылки, формируются динамически. (http:_//www.********.***/?books_best&group=11)
Так же динамически формируентся и ссылочный контент, соответствующий высылаемому пользователю образу html страницы.
Нада писать парсер страницы, высылаемой по запросу http:_//www.********.***/?books_best&group=11
с закачкой ссылок.
+ У ссылочного контента, скорее всего, ограниченое "время жизни"


 
isasa ©   (2007-05-13 15:14) [10]

Не видно .../?... - выделил жирным. Там или *.dll, или *.aspx в общем, что-то из серии Server Side.


 
homm ©   (2007-05-13 15:18) [11]

>Там или *.dll, или *.aspx
> в общем, что-то из серии Server Side.

Что в общем случае ниска не влияет на то, откуда ты вызываешь этот адресс. Дело может быть либо в куках, либо в какой-то защите «от дурака» вот для таково скачивания.


 
Сатир   (2007-05-13 15:23) [12]

TPro.exe


 
isasa ©   (2007-05-13 15:23) [13]

homm ©   (13.05.07 15:18) [11]
Что в общем случае ниска не влияет на то, откуда ты вызываешь этот адресс.

Да ради Бога. Новый сеанс - новые ссылки ...


 
isasa ©   (2007-05-13 15:27) [14]

Да, вопрос. А файлы
http:_//files.ru.********.***/data/bookcatalog/Tolstoy_Lev/L.Tolstoy%20-%20Ispoved".zip
качаются без проблем?


 
vasIZmax ©   (2007-05-13 17:39) [15]


> isasa ©   (13.05.07 15:27) [14]

Да, качается без проблем.
Хоть я их и скачал "по одиночке" файлы, но все же интересно как можно выйти из ситуации на будующее, мало ли чего прийдется качать.

Порекомендовали wget. Сейчас разбираюсь вот.


> Сатир   (13.05.07 15:23) [12]
> TPro.exe

Чего-то поисковики всякую ахинею выдают по запросу.


 
VirEx ©   (2007-05-13 18:12) [16]

offline explorer,русский интерфейс, бесплатный, качай хоть весь сайт, хоть по фильтрам


 
Сатир   (2007-05-13 18:53) [17]


> TPro.exe

Так это же приблуда для скачивания сайтов, называется TeleportPro, задаёшь начальную страницу, глубину скачивания, какие файлы скачивать, фильтры на линки и т.д. и т.п.
Оч. удобно.


 
vasIZmax ©   (2007-05-13 19:23) [18]


> Сатир   (13.05.07 18:53) [17]

... TeleportPro.... (хотя и говорилось о ней в [6])

В самом деле начал чего-то качать))), а потом появилось сообщение:

Ваш IP адрес заблокирован. Страницы сайта для Вас отдаваться не будут.
Доступ к сайту для программ рекурсивной закачки закрыт,
либо ваш компьютер запросил чрезвычайно большое количество
страниц с нашего сервера за короткое время.
Если это ошибочно - возвращайтесь на сайт через пару часов, ситуацию поправим.


Что ж подождем пару часиков:).

Всем спасибо за оказанную помощь)))



Страницы: 1 вся ветка

Форум: "Прочее";
Текущий архив: 2007.06.10;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.49 MB
Время: 0.045 c
15-1179482976
Ega23
2007-05-18 14:09
2007.06.10
фармацефты - отзовитесь!


15-1178900041
Juice
2007-05-11 20:14
2007.06.10
XML редактор


15-1179229189
Layner
2007-05-15 15:39
2007.06.10
Фокус со звонками из Молдовы, в чем секрет


2-1179386388
Alex7
2007-05-17 11:19
2007.06.10
Запрос с использованием имен других dataset (виртуальных таблиц)


2-1179691680
ppcumax
2007-05-21 00:08
2007.06.10
Вопрос о WebBrowser





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский