2

Я опубликовал очень похожий вопрос сегодня, но я хотел бы задать его еще раз с фокусом на wget/linux. Я надеюсь, что все в порядке.

Мне нужно создавать автономные копии веб-страниц программно в стеке LAMP, желательно с использованием PHP. Мне нужен источник HTML, прикрепленные изображения и таблицы стилей CSS.

Я могу запускать вещи из командной строки, но не устанавливать новые пакеты.

Я могу сделать wget --page-requisites на страницах, которые я хочу заархивировать. Это загружает все, что мне нужно, но не изменяет загруженные файлы HTML и CSS, чтобы указывать на архивные файлы.

Я ищу расширение / сценарий Perl / сценарий оболочки, который изменяет загруженные документы, чтобы они указывали на загруженные ресурсы, или, возможно, другое решение на основе Linux, которое делает это. Я уже проверил, httrack , похоже, не установлен на сервере ("whereis httrack" ничего не возвращает).

1 ответ1

9

Попробуйте параметр --convert-links :

После завершения загрузки преобразуйте ссылки в документе, чтобы сделать их пригодными для локального просмотра. Это влияет не только на видимые гиперссылки, но и на любую часть документа, которая ссылается на внешний контент, такой как встроенные изображения, ссылки на таблицы стилей, гиперссылки на контент, отличный от HTML, и т.д.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .