Я пытаюсь понять, как я могу сохранить веб-страницу со всеми связанными файлами, например: http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd/
Я хочу сохранить все файлы в каталоге, вроде сканера, но более ограниченного и, если возможно, в Firefox
Я пытаюсь понять, как я могу сохранить веб-страницу со всеми связанными файлами, например: http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd/
Я хочу сохранить все файлы в каталоге, вроде сканера, но более ограниченного и, если возможно, в Firefox
как ни странно, ответ был как-то удален.
вот ответ:
wget -r -l2 http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd
или же
wget -r -np http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd
см. https://www.gnu.org/software/wget/manual/html_node/Directory_002dBased-Limits.html.
'-np' '--no-parent' 'no_parent = on'
The simplest, and often very useful way of limiting directories is disallowing retrieval of the links that refer to the hierarchy above
чем начальный каталог, т.е. запрещающий восхождение к родительскому каталогу / каталогам.
The ‘--no-parent’ option (short ‘-np’) is useful in this case. Using it guarantees that you will never leave the existing hierarchy.
Предположим, вы выпускаете Wget с:
wget -r --no-parent http://somehost/~luzer/my-archive/ You may rest assured that none of the references to /~his-girls-homepage/ or /~luzer/all-my-mpegs/ will be followed. Only
интересующий вас архив будет загружен. По сути, «--no-parent» похож на «-I / ~ luzer / my-archive», только он обрабатывает перенаправления более разумным способом.
Note that, for HTTP (and HTTPS), the trailing slash is very important to ‘--no-parent’. HTTP has no concept of a “directory”—Wget
полагается на вас, чтобы указать, что каталог, а что нет. В ' http:// foo / bar / ' Wget будет считать 'bar' каталогом, а в ' http:// foo / bar ' (без косой черты) 'bar' будет считаться именем файла (поэтому «--no-parent» был бы бессмысленным, так как его родитель - «/»).