сохранить веб-страницу со всем связанным контентом

259
maazza

Я пытаюсь понять, как я могу сохранить веб-страницу со всеми связанными файлами, например: http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd/

Я хочу сохранить все файлы в каталоге, вроде сканера, но более ограниченного и, если возможно, в Firefox

1

1 ответ на вопрос

0
maazza

как ни странно, ответ был как-то удален.

вот ответ:

wget -r -l2 http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd

или же

wget -r -np http://docs.oasis-open.org/ubl/os-UBL-2.0/xsd

см. https://www.gnu.org/software/wget/manual/html_node/Directory_002dBased-Limits.html.

'-np' '--no-parent' 'no_parent = on'

The simplest, and often very useful way of limiting directories is disallowing retrieval of the links that refer to the hierarchy above 

чем начальный каталог, т.е. запрещающий восхождение к родительскому каталогу / каталогам.

The ‘--no-parent’ option (short ‘-np’) is useful in this case. Using it guarantees that you will never leave the existing hierarchy. 

Предположим, вы выпускаете Wget с:

wget -r --no-parent http://somehost/~luzer/my-archive/  You may rest assured that none of the references to /~his-girls-homepage/ or /~luzer/all-my-mpegs/ will be followed. Only 

интересующий вас архив будет загружен. По сути, «--no-parent» похож на «-I / ~ luzer / my-archive», только он обрабатывает перенаправления более разумным способом.

Note that, for HTTP (and HTTPS), the trailing slash is very important to ‘--no-parent’. HTTP has no concept of a “directory”—Wget 

полагается на вас, чтобы указать, что каталог, а что нет. В ' http: // foo / bar / ' Wget будет считать 'bar' каталогом, а в ' http: // foo / bar ' (без косой черты) 'bar' будет считаться именем файла (поэтому «--no-parent» был бы бессмысленным, так как его родитель - «/»).

Похожие вопросы