Скрипты, расширяющие wget - page-реквизиты?

1457
Pekka 웃

Я опубликовал очень похожий вопрос сегодня, но я хотел бы задать его еще раз с фокусом на wget / linux. Я надеюсь, что все в порядке.

Мне нужно создавать автономные копии веб-страниц программно в стеке LAMP, желательно с использованием PHP. Мне нужен источник HTML, прикрепленные изображения и таблицы стилей CSS.

Я могу запускать вещи из командной строки, но не устанавливать новые пакеты.

Я могу сделать wget --page-requisitesна страницах, которые я хочу архивировать. Это загружает все, что мне нужно, но не изменяет загруженные файлы HTML и CSS, чтобы указывать на архивные файлы.

Я ищу расширение / сценарий Perl / сценарий оболочки, который изменяет загруженные документы, чтобы они указывали на загруженные ресурсы, или, возможно, другое решение на основе Linux, которое делает это. Я уже проверил, httrackпохоже, не установлен на сервере ("whereis httrack" ничего не возвращает).

2

1 ответ на вопрос

9
Phil

Попробуйте --convert-linksвариант:

После завершения загрузки преобразуйте ссылки в документе, чтобы сделать их пригодными для локального просмотра. Это влияет не только на видимые гиперссылки, но и на любую часть документа, которая ссылается на внешний контент, такой как встроенные изображения, ссылки на таблицы стилей, гиперссылки на контент, отличный от HTML, и т. Д.

Как я мог не заметить это? Я попробую это и сообщу. Pekka 웃 14 лет назад 0

Похожие вопросы