1

Я пытаюсь понять, как я могу сохранить веб-страницу со всеми связанными файлами, например: http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd/

Я хочу сохранить все файлы в каталоге, вроде сканера, но более ограниченного и, если возможно, в Firefox

1 ответ1

0

как ни странно, ответ был как-то удален.

вот ответ:

wget -r -l2 http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd

или же

wget -r -np http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd

см. https://www.gnu.org/software/wget/manual/html_node/Directory_002dBased-Limits.html.

'-np' '--no-parent' 'no_parent = on'

The simplest, and often very useful way of limiting directories is disallowing retrieval of the links that refer to the hierarchy above

чем начальный каталог, т.е. запрещающий восхождение к родительскому каталогу / каталогам.

The ‘--no-parent’ option (short ‘-np’) is useful in this case. Using it guarantees that you will never leave the existing hierarchy.

Предположим, вы выпускаете Wget с:

wget -r --no-parent http://somehost/~luzer/my-archive/

You may rest assured that none of the references to /~his-girls-homepage/ or /~luzer/all-my-mpegs/ will be followed. Only

интересующий вас архив будет загружен. По сути, «--no-parent» похож на «-I / ~ luzer / my-archive», только он обрабатывает перенаправления более разумным способом.

Note that, for HTTP (and HTTPS), the trailing slash is very important to ‘--no-parent’. HTTP has no concept of a “directory”—Wget

полагается на вас, чтобы указать, что каталог, а что нет. В ' http:// foo / bar / ' Wget будет считать 'bar' каталогом, а в ' http:// foo / bar ' (без косой черты) 'bar' будет считаться именем файла (поэтому «--no-parent» был бы бессмысленным, так как его родитель - «/»).

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .