Я хотел бы отразить сайт с помощью wget. Проблема в том, что на сайте есть несколько языковых мутаций, которые переключаются с помощью параметра строки запроса, и когда wget начинает скачивать версию на другом языке, она забивает предыдущую. Например, он начинается с index.html, захватывает часть сайта, а затем встречает ссылку на index.html?lang = foo, начинает загрузку нового варианта языка и перезаписывает предыдущий index.html новым. Что я могу сделать, когда хочу их всех?
1
1 ответ
1
Поскольку страницы на самом деле одинаковы, я не слишком уверен ...
Вы можете попробовать HTTrack, который является очень гибким копиром сайта, и вы можете настроить правила, такие как исключение путей / страниц с определенной строкой запроса ... Или, возможно, он сможет загрузить все языки, я не уверен на 100%, так как не столкнулся с этой проблемой.