Создание --convert-ссылок на wget уважает http против https

329
jonathanverner

Я использую следующую команду для зеркалирования веб-сайта https:

wget --directory-prefix=/tmp/mirror --mirror --no-host-directories \ --regex-type pcre --reject-regex "$SKIP_REGEXP" \ --convert-links --adjust-extension --header "Accept-Language: en-US,en" \ --header "X-Build-Mirror: True" -o /tmp/mirror.log https://logic.ff.cuni.cz 

(На самом деле, команда выполняется в одну строку - я разбил ее на несколько строк для улучшения читаемости.)

Согласно документации на --convert-linksфлаге, ссылки на скачанные файлы преобразуются в относительные ссылки для локального просмотра и ссылок на файлы, которые не загружены (например, из - за --reject-regexp) преобразуются в абсолютные ссылки. Однако при преобразовании, хотя URL-адрес хоста является URL-адресом https, все абсолютные ссылки становятся ссылками http !

Это ошибка wgetили есть какой-то способ заставить его соблюдать тип протокола? (Я знаю, что могу использовать --https-only флаг, но это помешало бы получить любой http-ресурс.)

2
Это почти наверняка ошибка в Wget. Я открою сообщение об ошибке от вашего имени. darnir 5 лет назад 0

0 ответов на вопрос

Похожие вопросы