Рекурсивно загружать файлы с веб-сайта с помощью wget

410
harper

Я хочу скачать набор файлов с веб-сайта. HTML-документы связаны с

<a href="https://website.com/path/to/folder/jjxx.70" data-linktype="relative-path">bla</a> 

после загрузки первичного файла путь к папке / удаляется, как и ожидалось. Оставшаяся строка:

<a href="jjxx.70" data-linktype="relative-path">bla</a> 

Но wget не загружает указанные файлы, хотя я передал параметр mirror . Все, что я получаю, это:

c:\>wget-1.12 -m -p -E https://website.com/path/to/folder/jjroot ... progress information ... 2018-09-15 18:52:33 (708 KB/s) - `website.com/path/to/folder/jjroot.html' saved [25784/25784]  FINISHED --2018-09-15 18:52:33-- Downloaded: 1 files, 25K in 0.04s (708 KB/s) 
  • Почему wget скачивает только "1 файл"?
  • Как я могу сказать, чтобы wget действительно загружал рекурсивно?

Изменить : так как меня спросили: версия Wget является 1.12. Я также использовал wget 1.19.4 с тем же результатом.

1
Вы читали руководство по wget? Здесь есть целый раздел о рекурсивных загрузках. RalfFriedl 5 лет назад 1
Сначала поделитесь версией Wget, которую вы используете. `wget -V`. Я вижу, что вы используете его в Windows. Очень часто люди заканчивают тем, что используют очень древние версии Wget, где половина решений не будет работать. РЕДАКТИРОВАТЬ: Кажется, что вы используете Wget 1.12, которому около 6 лет. Последний выпуск 1.19.5, который был выпущен в этом году. darnir 5 лет назад 0
@darnir Хорошо, wget-1.12 сообщает как версия "1.12.1-devel". Это не удивительно для меня. harper 5 лет назад 0

1 ответ на вопрос

2
Ahmed Abdelazim

Команда:

wget -r -np -l 1 -A zip http://example.com/download/ 

Значения параметров:

-r, --recursive specify recursive download. -np, --no-parent don't ascend to the parent directory. -l, --level=NUMBER maximum recursion depth (inf or 0 for infinite). -A, --accept=LIST comma-separated list of accepted extensions 

Вы можете настроить необходимые расширения, используя параметр -A

ссылка

https://stackoverflow.com/questions/13533217/how-to-download-all-links-to-zip-files-on-a-given-web-page-using-wget-curl 
К сожалению, это ничего не меняет. Это все еще просто скачать один файл. harper 5 лет назад 0