Wget - сложность, исключая домены и каталоги

593
Ray Woodcock

Я использую Wget в Windows 7. Я считаю, что это ограничивает меня до Wget 1.11.4.

Для тех, кто интересуется подробностями, я разместил образец файла wgetrc . Это образец, который я сейчас использую. Моя команда Wget выглядит следующим образом:

wget 2> "I:\Current\Wget\wgeterr.log" 

У меня проблемы с опциями, которые должны ограничивать загрузку. Как подробно описано в конце wgetrc (выше), некоторые формы этих ограничений, похоже, не работают.

В частности, я думаю, что я правильно указал с помощью exclude_domains, что я не хочу включать twitter.com в загрузку, как папку на том же уровне, что и загружаемый мной веб-сайт (т.е. raywoodcockbio.wordpress.com), Тем не менее я получаю twitter.com тем не менее.

Вопрос в том, как я могу предотвратить включение twitter.com (в том числе Facebook и других социальных сетей) в мою загрузку?

2

1 ответ на вопрос

0
stderr

Look at the parameter exclude_directories or -X of wget. The -X option specify is a list of directories excluded from the download. E.g. if you do not want Wget to download things from /foo-bar directory, specify -X /foo-bar on the command line.

По какой-то причине это не может помешать созданию twitter.com и www.facebook.com, независимо от того, указываю ли я исключение, например, twitter.com или /twitter.com. Папка twitter.com создается на верхнем уровне, то есть на том же уровне каталогов, что и желаемая папка для скачивания. Сбой также произойдет, если я укажу twitter.com или /twitter.com с exclude_directories в wgetrc. Ray Woodcock 10 лет назад 0