1

Я хотел бы отразить сайт с помощью wget. Проблема в том, что на сайте есть несколько языковых мутаций, которые переключаются с помощью параметра строки запроса, и когда wget начинает скачивать версию на другом языке, она забивает предыдущую. Например, он начинается с index.html, захватывает часть сайта, а затем встречает ссылку на index.html?lang = foo, начинает загрузку нового варианта языка и перезаписывает предыдущий index.html новым. Что я могу сделать, когда хочу их всех?

1 ответ1

1

Поскольку страницы на самом деле одинаковы, я не слишком уверен ...

Вы можете попробовать HTTrack, который является очень гибким копиром сайта, и вы можете настроить правила, такие как исключение путей / страниц с определенной строкой запроса ... Или, возможно, он сможет загрузить все языки, я не уверен на 100%, так как не столкнулся с этой проблемой.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .