8

Я хочу скачать следующий поддомен с рекурсивной опцией, используя wget:

www.example.com/A/B

Так что, если этот URL имеет ссылки на www.example.com/A/B/C и www.example.com/A/B/D , эти два также должны быть загружены.

Но я не хочу, чтобы что-либо за пределами поддоменов www.example.com/A/B было загружено. Например, если www.example.com/A/B/C имеет ссылку на www.example.com , страница www.example.com загружаться не должна.

Какую команду wget мне следует использовать?

2 ответа2

9

Используйте параметр --no-parent в wget:

--no-parent

Никогда не поднимайтесь в родительский каталог при рекурсивном извлечении. Это полезный параметр, поскольку он гарантирует, что будут загружены только файлы ниже определенной иерархии.

2

Попробуйте использовать опцию -I чтобы указать каталог для загрузки:

wget -r -I www.example.com/A/B/C,www.example.com/A/B/D

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .