Я пытаюсь помочь коллеге на MacBook Air MacOsx 10.11.06 в архивировании веб-сайта с помощью wget (версия 1.19.1), установленной через brew. Используя эту команду.
wget --recursive --no-clobber --page-requisites --html-extension --convert-links --restrict-file-names=windows --domain scart.be --warc-file=20161103_scart www.scart.be
Однако это приводит к ошибке в терминале:
Преобразование ссылок в http://www.scart.be/index.html?q=fr%2Fnode%2F1135.html 35-27 Обнаружена неполная или недопустимая многобайтовая последовательность
Я протестировал его, и он отлично работает на компьютере с Ubuntu xenial (wget версии 1.17.1) и на другой системе, MacOsx 10.11.06. (версия wget 1.19.1)
Я попытался изменить "--restrict-file-names = windows" на "--restrict-file-names = nocontrol", ничего не изменилось. Если мы пытаемся импортировать файл .warc в проигрыватель Webrecorder, он отображает "не найдено закладок", где он работает с файлами .warc, созданными на двух других машинах, упомянутых ранее. На других сайтах я обнаружил, что эта ошибка связана с кодировкой символов и застряла там.