При выполнении рекурсивной загрузки я определяю шаблон через параметр -R, чтобы wget отклонял его, но если этот файл является HTML-файлом, wget загружает файл независимо от того, соответствует он шаблону или нет.

например

wget -r -R "*dynamicfile*" example.com

по-прежнему получает файлы, такие как example.com/dynamicfile1.html

Есть ли способ предотвратить это?

1 ответ1

0

Это происходит потому, что wget использует html-файлы, чтобы знать, где сканировать дальше, когда сканирует веб-страницу. Я бы просто позволил wget заняться своими делами, а затем сделать rm * .html после того, как это будет сделано, или что-то подобное.

РЕДАКТИРОВАТЬ: rsync *dynamicfile* /foo/bar во второй каталог может быть лучшим способом фильтрации ваших файлов, чтобы сохранить только те, которые имеют правильное имя (при условии, что вы хотите сохранить некоторые html-файлы, если они имеют правильное имя)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .