HTTRACK делает частичную загрузку

370
Br. Sayan

Мы используем, HTTRACKчтобы загрузить весь сайт для просмотра в автономном режиме.

Проблема даже в загрузке всего сайта с уровнем 4 ( -r4), некоторые ссылки не работают.

Например, если вы используете httrack для захвата сайта:

http://advaitasharada.sringeri.net/display/bhashya/Gita

Он захватывает только часть этого, но оставляет ссылки на правой стороне. Другие ссылки, содержащие другие главы Гиты, помечены #fragments.

http://advaitasharada.sringeri.net/display/bhashya/Gita#BG_C02 (ссылка работает только при нажатии в браузере)

  1. Почему не HTTRACKскачать все ссылки? Что делать?
  2. Также searchне работает. Это приводит к исходному домену сайта (который требует подключения к интернету).
3
Ответ на первую часть: веб-сайт использует * серверные сценарии *, то есть сервер генерирует веб-страницы * на лету * при выполнении запроса. HTTRack может загружать только статические веб-страницы и, таким образом, пропускает части, которые создаются на лету. Karan Karan 6 лет назад 1
он доступен для скачивания, довольно большой, но 2,6 ГБ, вы можете попробовать wget Junme 6 лет назад 1
Спасибо @KaranKaran и @Junme! Это то, что я подозревал. Это включает в себя сценарии на стороне сервера! Junme, я пробовал `wget`, но он не работал. Размер не проблема. Я дал `-r6` и` HTTRACK` скачал 6,6 ГБ! Бог знает, откуда у него столько данных! Не могли бы вы опубликовать команду `wget`, которую вы использовали в качестве ответа? Вы проверили правые боковые ссылки сайта? Br. Sayan 6 лет назад 0

1 ответ на вопрос

0
Karan Karan

Веб-сайт использует серверные скрипты, то есть сервер генерирует веб-страницы на лету, когда сделан запрос. HTTRack может загружать только статические веб-страницы и, таким образом, пропускает части, которые создаются на лету.

Есть ли другие способы загрузки сайта? Br. Sayan 6 лет назад 0