Я пытаюсь загрузить содержимое каталога, размещенного на сервере, используя wget в терминале cygwin. У меня нет проблем с получением файлов, но все они являются архивом .gz и после загрузки их невозможно открыть ... вот строка, которую я использую:

wget -rnH --cut-dir=5 --header="Accept-Encoding:gzip" "http://someHost/bla/bli/bla/bla/2014/0254_REV2"

У кого-нибудь есть идеи, как получить полезный архив с помощью wget?

Буду признателен за любую помощь, заранее спасибо за мысль;)

1 ответ1

0

Я нашел это:

Если вы запрашиваете содержимое gzip (используя заголовок accept-encoding: gzip, что правильно), то, насколько я понимаю, wget не сможет затем прочитать содержимое. Таким образом, вы получите один сжатый файл на диске для первой попавшейся страницы, но без другого контента.

То есть вы не можете использовать wget для запроса содержимого в формате gzip и одновременного просмотра всего сайта.

Я думаю, что есть патч, который позволяет wget поддерживать эту функцию, но его нет в версии по умолчанию.

Если вы включите флаг -S, вы сможете определить, отвечает ли веб-сервер правильным типом контента. Например,

wget -S --header="accept-encoding: gzip" wordpress.com

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .