Похоже, wget
и Firefox не анализирует CSS для ссылок, чтобы включить эти файлы в загрузку. Вы можете обойти эти ограничения, написав все, что можете, и написав сценарий извлечения ссылок из любого CSS или Javascript в загруженных файлах, чтобы создать список файлов, которые вы пропустили. Затем второй прогон wget
по этому списку ссылок может захватить все, что было пропущено (используйте -i
флаг, чтобы указать URL-адреса списка файлов).
Если вам нравится Perl, в CPAN есть модуль CSS :: Parser, который может дать вам простой способ извлечения ссылок таким способом.
Обратите внимание, что wget
анализируется только определенная HTML-разметка ( href
/ src
) и css uris ( url()
), чтобы определить, какие реквизиты страницы нужно получить. Вы можете попробовать использовать надстройки Firefox, такие как DOM Inspector или Firebug, чтобы выяснить, добавляются ли сторонние изображения, которые вы не получаете, через Javascript - если это так, вам нужно прибегнуть к скрипту или плагину Firefox, чтобы получить их тоже.