Wget - Проблемы рекурсивной загрузки с аутентификацией

953
user3738916

Поэтому я пытаюсь загрузить весь домен частной вики-страницы. Я сохранил куки в файле cookies.txt и использую их с wget для аутентификации следующим образом:

wget --load-cookies=cookies.txt --recursive --no-parent --convert-links --backup-converted --adjust-extension --limit-rate=500k https://wiki-to-download

Продолжается загрузка всего домена вики. На первый взгляд, это сработало. Я открыл html файл главной страницы локально в своем браузере, но почти все ссылки, кроме домашней страницы, одинаковы: страница входа ...

Я предполагаю, что он подтвердил мою подлинность, когда-то разрешив загрузку домашней страницы, но затем не сохраняет мои учетные данные сохраненными, так как он извлекает остальные страницы, заставляя его загружать страшную «Требуемую для входа страницу» для каждой. Как я мог избежать этого? Другими словами, как я могу убедиться, что каждый файл загружен правильно, как если бы я был зарегестрирован за все время?

1

1 ответ на вопрос

3
MartinM

На первой странице, вероятно, также есть ссылка на выход из системы, которая делает именно то, для чего она предназначена. Чтобы избежать этого, используйте -R (например, -R "* logout *"), как указано здесь