wget: отключить принудительное восстановление .html

Question

wget: отключить принудительное восстановление .html

543

Mike B 2010-04-20 в 17:13

При выполнении рекурсивной загрузки я определяю шаблон через параметр -R, чтобы wget отклонял его, но если этот файл является HTML-файлом, wget загружает файл независимо от того, соответствует он шаблону или нет.

например

wget -r -R "* dynamicfile *" example.com

по-прежнему получает файлы, такие как example.com/dynamicfile1.html

Есть ли способ предотвратить это?

0

1 ответ на вопрос

0

Accepted Answer · 2010-04-20 17:32:32

Это происходит потому, что wget использует html-файлы, чтобы знать, где сканировать дальше, когда сканирует веб-страницу. Я бы просто позволил wget заняться своими делами, а затем сделать rm * .html после того, как это будет сделано, или что-то подобное.

РЕДАКТИРОВАТЬ: Выполнение rsync *dynamicfile* /foo/barвторого каталога может быть лучшим способом фильтрации ваших файлов, чтобы сохранить только те, которые имеют правильное имя (при условии, что вы хотите сохранить некоторые html-файлы, если они имеют правильное имя)

wget: отключить принудительное восстановление .html

1 ответ на вопрос

Похожие вопросы