1

Я пытаюсь создать статическую версию динамически управляемого сайта с помощью wget.

Проблема в том, что когда я делаю это на сайте с китайскими иероглифами, а не на странице аккуратно сформированных китайских иероглифов, я в конечном итоге получаю искаженную ерунду ascii, но все равно хорошо отформатирован.

Это команда, которую я сейчас выполняю:

wget -P 1 -mpck --user-agent="" -e robots=off --wait 1 -E http://awebsite.com

Спасибо.

2 ответа2

1

Похоже, вы имеете в виду, что если вы заходите на сайт, все хорошо, но если вы загружаете страницу и указываете свой браузер на загруженный файл, он искажается. Два предложения:

  • Проверьте исходный код HTML и посмотрите, установлена ли в нем кодировка; это может быть установлено только как метаданные HTTP.
  • Вы также загружаете таблицу стилей? Попробуйте опцию -p .
1

Попробуйте добавить --header='Accept-Language: zh'

например.

wget -P 1 -mpck --user-agent="" -e robots=off --wait 1 -E --header='Accept-Language: zh' http://awebsite.com

Если это не сработает, попробуйте проверить, какой код «Content-Language» появляется в заголовках HTTP:

curl -I http://awebsite.com

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .