wget не отслеживает перенаправление интернет-страниц

316
AlwaysLearning

Для конкретного примера проблемы, когда я иду по следующему адресу в обычном браузере:

http://www.aaai.org/ocs/index.php/SOCS/SOCS16/paper/viewFile/13951/13240 

Меня перенаправляют на httpsто, что содержит файл PDF:

https://www.aaai.org/ocs/index.php/SOCS/SOCS16/paper/viewFile/13951/13240 

Тем не менее, когда я делаю:

wget http://www.aaai.org/ocs/index.php/SOCS/SOCS16/paper/viewFile/13951/13240 

перенаправление не происходит и PDF не извлекается. Обратите внимание, что это происходит во время выполнения скрипта, в котором у меня есть только httpадрес. Есть ли способ заставить wgetследовать этому перенаправлению и получить файл?

0
Этот сайт использует тип перенаправления, который wget не поддерживает. Но почему вы не можете просто изменить `http` на` https` перед загрузкой, например, с помощью `sed 's / http: \ / \ // https: \ / \ // g'`? SpiderPig 6 лет назад 0
Когда пользователь моего скрипта запрашивает статью, он ищет ссылку в Google Scholar. Таким образом, моему сценарию может потребоваться получить статьи из разных источников, а не только из «aaai.org». Таким образом, перенаправление может включать в себя другие изменения адреса, не только с `http` на` https`. Следовательно, мне нужно общее решение. AlwaysLearning 6 лет назад 0
Возможно, вы захотите использовать другой язык для этого, например, python, а затем вы напишете некоторый код для обработки перенаправления самостоятельно. SpiderPig 6 лет назад 0

0 ответов на вопрос