Просмотреть архивированный сайт

197
dtmland

У меня есть файлы HTML / веб-страницы, хранящиеся в папке локально на моем компьютере. Я могу просматривать этот контент просто отлично, используя любой браузер. Однако в долгосрочной перспективе я бы предпочел, чтобы содержимое хранилось в каком-либо архивном формате (ZIP?). Я мог бы сделать это и вручную извлечь содержимое каждый раз, когда я хочу просмотреть страницы. Однако это имеет ряд недостатков.

Как я могу просмотреть файлы html / webpage внутри файла архива со следующими условиями:

  1. Не нужно вручную извлекать содержимое каждый раз

  2. Содержимое не должно быть извлечено в тот же каталог, что и архив - оно должно идти куда-то еще, как системный временный каталог

  3. Не нужно извлекать ВСЕ содержимое только для просмотра нескольких страниц. Мне бы хотелось, чтобы решение могло извлекать только содержимое, необходимое для отображения текущей просматриваемой страницы.

0
Учитывая эти требования, почему бы вам не написать сценарий, который бы сделал это для вас? slybloty 10 лет назад 1
@slybloty Почему голосование против? dtmland 10 лет назад 1
Недостатком был не я. slybloty 10 лет назад 0
@slybloty Ах, должно быть, был какой-то трус. Не оставил комментарий. dtmland 10 лет назад 0
Я мог бы, вероятно, придумать сценарий для выполнения всего ожидаемого пункта 3. Я не уверен, как я мог бы сделать это? Есть идеи? dtmland 10 лет назад 0
Простейшим способом выполнения пункта 3 будет использование сценария для извлечения подкаталога, в котором находится ваша страница, а также изображений и каталогов CSS. Это должно извлечь большинство вещей, включенных в любую данную страницу, сокращая ненужные извлеченные файлы. (Upvoted, чтобы противостоять понижению, кстати) Yitzchak 10 лет назад 0

1 ответ на вопрос

3
slybloty

The one way, that I can think of, to accomplish your requirements would be to write a script that does this. When you want to see a page from the archive, open it with the script.

This way, you can have the script do the following:

  • create a temporary folder
  • read the HTML file
  • grab all the links needed
  • go through them and grab the rest of links, if any
  • create the structure from the archive
  • extract the needed files (from links) into the newly created structure
  • display the page
  • remove the temp folder upon closing the page

I know it involves a little bit of work, but, depending on the usage and necessity it might be worth it.

Похожие вопросы