2

Мне нужно периодически проходить сайт, чтобы обновить кеш сервера. Это управляемый базой данных сайт с очень многими (тысячами) страницами. Я использую wget для локального зеркалирования сайта на том же сервере, поэтому я использую эту команду:

wget --mirror localhost

Через некоторое время он внезапно останавливается с этим сообщением:

HTTP-запрос отправлен в ожидании ответа ... Отменено

Это происходит всегда, но не по одному и тому же адресу. И я попробовал на другом сервере с тем же результатом.

Опция --debug не предоставляет никакой полезной информации, равно как и файл журнала Apache.

Что может быть причиной этой проблемы? Я подозреваю, что в буфере не хватает памяти и т.д. Или переполнение стека.

В качестве альтернативы, есть ли другие инструменты командной строки, которые могут сделать то же самое?

Это Wget 1.11.4 на Debian Lenny.

Мартин

2 ответа2

1

Возможно, что сервер выполняет какой-то анализ ваших шаблонов загрузки и разбивает ваши запросы. Посмотрите на некоторые опции wget для ограничения скорости ваших запросов - посмотрите на --limit-rate , --wait и --random-wait .

0

Я не нашел способов заставить wget пройти весь сайт без преждевременного завершения, но я наткнулся на httrack, который отлично справляется со своей задачей.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .