1

Я хочу скачать набор файлов с веб-сайта. HTML-документы связаны с

<a href="https://website.com/path/to/folder/jjxx.70" data-linktype="relative-path">bla</a>

после загрузки первичного файла путь к папке / удаляется, как и ожидалось. Оставшаяся строка:

<a href="jjxx.70" data-linktype="relative-path">bla</a>

Но wget не загружает указанные файлы, хотя я передал параметр mirror . Все, что я получаю, это:

c:\>wget-1.12 -m -p -E https://website.com/path/to/folder/jjroot
... progress information ...
2018-09-15 18:52:33 (708 KB/s) - `website.com/path/to/folder/jjroot.html' saved [25784/25784]

FINISHED --2018-09-15 18:52:33--
Downloaded: 1 files, 25K in 0.04s (708 KB/s)
  • Почему wget скачивает только "1 файл"?
  • Как я могу сказать, чтобы wget действительно загружал рекурсивно?

Изменить: так как меня спросили: версия Wget является 1.12. Я также использовал wget 1.19.4 с тем же результатом.

1 ответ1

2

Команда:

wget -r -np -l 1 -A zip http://example.com/download/

Значения параметров:

-r,  --recursive          specify recursive download.
-np, --no-parent          don't ascend to the parent directory.
-l,  --level=NUMBER       maximum recursion depth (inf or 0 for infinite).
-A,  --accept=LIST        comma-separated list of accepted extensions

Вы можете настроить необходимые расширения, используя параметр -A

ссылка

https://stackoverflow.com/questions/13533217/how-to-download-all-links-to-zip-files-on-a-given-web-page-using-wget-curl

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .