Обычно я использую GNU wget для рекурсивного захвата сайтов.
Но я хочу получить некоторые веб-сайты с множеством URL-адресов Unicode для разных языков, и я хотел бы сохранить Unicode в именах файлов. (Вот пример.)
В wget есть переключатели командной строки --local-encoding
и --remote-encoding
но они, похоже, не поддерживают встроенную кодировку файловой системы Windows, UTF-16. Я думаю, что это потому, что wget предназначен для * nix, который никогда не имеет UTF-16, так как системная кодировка имен файлов и портов Windows wget не являются официальными.
Как я могу сделать это под Windows и сохранить файлы, используя правильный Юникод?