4

Это правильный способ загрузить веб-сайт со всеми изображениями и CSS-файлами, чтобы он имел тот же макет, что и оригинал, но я не знаю, почему параметры -K --backup-converted и -E --adjust-extension необходимы.

После обновления веб-сайта, как мне обновить резервную / загруженную копию веб-сайта? Так же, как для загрузки?

wget -mpHkKEb -t 1 -e robots=off -U 'Mozilla/5.0 (X11; Ubuntu;
Linux x86_64; rv:40.0) Gecko/20100101 Firefox/40.0' http://www.example.com
  • –m (--mirror) : включить опции, подходящие для зеркалирования (бесконечная рекурсивная загрузка и временные метки).

  • -p (--page-requisites) : загрузить все файлы, необходимые для правильного отображения заданной HTML-страницы. Это включает в себя такие вещи, как встроенные изображения, звуки и ссылочные таблицы стилей.

  • -H (--span-hosts) : включить охват всех хостов при выполнении рекурсивного поиска.

  • –k (--convert-links) : после загрузки преобразовать ссылки в документе для локального просмотра.

  • -K (--backup-converted) : при конвертации файла сделайте резервную копию оригинальной версии с суффиксом .orig. Влияет на поведение -N.

  • -E (--adjust-extension) : добавить правильное расширение в конец файла.

  • -b (--background) : перейти к фону сразу после запуска. Если выходной файл не указан через -o, вывод перенаправляется в wget-log.

  • -e (--execute) : выполнить команду (robots = off).

  • -t number (--tries=number) : установить количество попыток для номера.

  • -U (--user-agent) : идентифицировать как строку агента для HTTP-сервера. Некоторые серверы могут навсегда запретить вам рекурсивную загрузку, если вы отправите пользовательский агент по умолчанию.

1 ответ1

1
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent http://example.org

я использовал это в прошлом

из Make Offline Mirror сайта с помощью wget:

Объяснение различных флагов:

  • --mirror - делает (среди прочего) загрузку рекурсивной.
  • --convert-links - конвертировать все ссылки (также на такие вещи, как таблицы стилей CSS) в относительные, чтобы они подходили для просмотра в автономном режиме.
  • --adjust-extension - добавляет подходящие расширения к именам файлов (html или css) в зависимости от их типа содержимого.
  • --page-requisites - загружать такие вещи, как таблицы стилей CSS и изображения, необходимые для правильного отображения страницы в автономном режиме.
  • --no-parent - при повторении не подниматься в родительский каталог. Это полезно для ограничения загрузки только частью сайта.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .