Как использовать wget для получения копий документов сайта Google Code?

2376
Alex Reynolds

У меня есть проект Google Code, в котором есть много вики-документации. Я хотел бы создать копию этой документации для просмотра в автономном режиме. Я хотел бы использоватьwget или подобную утилиту.

Я пробовал следующее:

$ wget --no-parent \ --recursive \ --page-requisites \ --html-extension \ --base="http://code.google.com/p/myProject/" \ "http://code.google.com/p/myProject/" 

Проблема в том, что ссылки внутри зеркальной копии имеют такие ссылки:

file:///p/myProject/documentName 

Такое переименование ссылок таким способом вызывает 404 (не найденных) ошибок, поскольку ссылки указывают на то, что они не действительны в файловой системе.

Какие варианты я должен использовать вместо этого wget, чтобы я мог сделать локальную копию документации сайта и других страниц?

0
Просто к сведению, источник для вики-страниц находится в вашем исходном хранилище. Таким образом, вы можете загрузить их все и запустить через свой собственный рендер. Der Hochstapler 12 лет назад 0
Это не помогает мне, потому что содержит много разметки кода Google. Я спрашиваю, как бы я сделал это с `wget` или` curl` (или подобным), я думаю. Alex Reynolds 12 лет назад 0
@AlexReynolds это поможет этому https://addons.mozilla.org/en-US/firefox/addon/google-code-wiki-viewer/ HackToHell 12 лет назад 0

2 ответа на вопрос

2
vag

Если URL выглядит так:

https://code.google.com/p/projectName/downloads/detail?name=yourFILE.tar.gz 

Превратите это в:

$wget https://projectName.googlecode.com/files/yourFILE.tar.gz 

Это прекрасно работает для меня.

0
Alex Reynolds

После долгих тренировок мне удалось заставить работать на меня следующее:

$ wget --no-parent \ --recursive \ --page-requisites \ --html-extension \ --convert-links \  -E -l 3 \ http://code.google.com/p/myProject/ 

Результат полностью автономен, сейчас.