Ошибка wget "Преобразование ссылок в" url "Обнаружена неполная или недопустимая многобайтовая последовательность"

591
LoJoe

Я пытаюсь помочь коллеге на MacBook Air MacOsx 10.11.06 в архивировании веб-сайта с помощью wget (версия 1.19.1), установленной через brew. Используя эту команду.

wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=windows --domain scart.be --warc-file=20161103_scart www.scart.be 

Однако это приводит к ошибке в терминале:

Преобразование ссылок в http://www.scart.be/index.html?q=fr%2Fnode%2F1135.html 35-27 Обнаружена неполная или недопустимая многобайтовая последовательность

Я протестировал его, и он отлично работает на компьютере с Ubuntu xenial (wget версии 1.17.1) и на другой системе, MacOsx 10.11.06. (версия wget 1.19.1)

Я попытался изменить "--restrict-file-names = windows" на "--restrict-file-names = nocontrol", ничего не изменилось. Если мы пытаемся импортировать файл .warc в проигрыватель Webrecorder, он отображает «не найдено закладок», где он работает с файлами .warc, созданными на двух других машинах, упомянутых ранее. На других сайтах я обнаружил, что эта ошибка связана с кодировкой символов и застряла там.

2
Сначала вам может понадобиться найти точную веб-страницу, которая создает проблему, чтобы увидеть внутри нее, если некоторые символы имеют недопустимые кодировки. Также ваша проблема повторяется несколько раз? Иначе это может быть временная проблема с сетью или даже проблема с нехваткой места локально для загрузки всего? Patrick Mevzek 6 лет назад 0

0 ответов на вопрос

Похожие вопросы