Скачайте и автоматически переименуйте в тексте гиперссылки все файлы PDF на странице

420
Custom Soundtrack

Я использую Chrono Download Manager для массовой загрузки всех файлов типа X на заданной странице, и это работает очень хорошо.

Я заинтересован в загрузке многих файлов PDF с веб-сайта, у каждого из которых есть неописательные имена файлов. Текст гиперссылки для каждого файла, однако, совершенно описательный.

Есть ли какой-нибудь разумный способ для не кодировщика осуществить загрузку всех этих файлов и автоматически переименовать каждый из них, чтобы имя файла совпадало с текстом гиперссылки для загрузки?

Если это имеет значение, это страница.

Спасибо!

0
Я не понимаю, как это могло бы помочь, поскольку моим единственным препятствием является автоматическое переименование автоматически загружаемых файлов в соответствии с текстом гиперссылки. Я что-то упускаю из aria2? Custom Soundtrack 6 лет назад 0

1 ответ на вопрос

0
Biswapriyo

Следующая процедура с aria2 не полностью автоматическая. Вы должны вручную скопировать и вставить все ссылки для скачивания в простой текстовый файл. но aria2 может автоматически загружать и переименовывать в соответствии с этим текстовым файлом.

Итак, как вы делаете этот текстовый файл? Сначала создайте новый текстовый файл в любом текстовом редакторе. Пусть это имя текстового файла aria2-script.txtили любое имя, которое вы хотите. Поместите в него ссылки на скачивание Dircet. Не забудьте поставить прямые ссылки на скачивание, только иначе aria2 загрузит веб-страницу. Вот синтаксис этого aria2-script.txtфайла:

http://example-link.com/direct-link/fileA.pdf out=fileA.pdf checksum=sha-1=sha-goes-here 

Вы можете пропустить часть контрольной суммы. Добавить много ссылок, как вы хотите. Не забудьте поставить два пробела перед тем out=и checksum=(и другие варианты) в противном случае aria2 будет принимать его в качестве URL. Например, ваш текстовый файл будет:

https://www.csb.gov/assets/Record/Board_Action_Report_-_Notation_Item_2018-57.pdf out=Recommendation 2012-03-I-CA-R14, from the Chevron Refinery Fire investigation.pdf  https://www.csb.gov/assets/Record/Board_Action_Report_-_Notation_Item_2018-56.pdf out=Recommendation 2012-03-I-CA-R13, from the Chevron Refinery Fire investigation.pdf 

Скопируйте эти прямые ссылки для скачивания, щелкнув правой кнопкой мыши ссылку на файл на этой веб-странице. Теперь загрузите aria2 со страницы выпуска GitHub, откройте командную строку в этой папке и выполните команду:

aria2c.exe --check-certificate=false --dir="Folder" --input-file="aria2-script.txt" 

--check-certificate=falseВариант просто удалить сложность сертификации. Есть много вариантов, чтобы ускорить процедуру загрузки. aria2 автоматически переименует эти файлы. Не забудьте указать полный путь aria2c.exeи aria2-script.txtфайл. Для получения более подробной информации прочитайте этот aria2 список опций и aria2 входного файла .

Я думаю, что это только не будет работать, потому что, как видно из примера, ссылки для скачивания не являются прямыми. Vinícius Simões 6 лет назад 0