1

У меня есть список файлов с именами, написанными в том, что написано в VISCII или в каком-то восточноазиатском формате (я знаю, что это вьетнамский язык). Я хочу использовать iconv для преобразования имен файлов в UTF-8, но не знаю, каков текущий набор символов. Я пробовал несколько вариантов и получил ошибки с iconv .

Вот несколько примеров в списке файлов:

1 2 3 CHIA ðÈI LÈýI V-¦_(831641).mid CON ð¦i¦NG CHUýNG TA ðI_(829013).mid HAÌY SÈýNG CU¦NG TI¦NH Y-U_(830818) M-Y TI¦NH Y-U_(830639).mid NG¦i¦I CHI-ýN SIÌ -ýY_(830491).mid SAO CH¦A TH-ýY HȦI -M (A)_(829702).mid TR-N MAÊNH ð-ýT TI¦NH NG¦i¦I_(829041).mid

Конверсия должна получиться так:

1 2 3 chia ðÈI LÈýI V-¦.mid

в

1 2 3 chia đôi lối về.mid

Каков наилучший способ найти кодировку? Я пытался от VISCII cp936 cp1258 в UTF-8 , но ничего не работает.

К вашему сведению: я установил вьетнамский языковой пакет, и он, кажется, работает для некоторых программ, но для проводника файлов в Windows 10 он не работает. Я думаю, может быть, изменить шрифт по умолчанию на что-то, что позволяет набор символов, но мне придется взломать реестр в Windows 10.

1 ответ1

0

Мне пришлось скачать вьетнамский языковой пакет в настройках языка и региона Windows 10.

Скинул меня, потому что все файлы были заархивированы. Я распаковал их перед установкой языкового пакета, поэтому все имена файлов были преобразованы из UTF-16 (или одного из кодировок Восточной Азии) в UTF-8 (который, я думаю, не включает вьетнамский набор символов) навсегда.

Затем я установил вьетнамский языковой пакет, поэтому при открытии файлов содержимое читалось правильно с правильным набором символов, но имена файлов оставались прежними.

Все, что мне нужно было сделать, это удалить первую партию распаковать и разархивировать снова, и был использован правильный набор символов.

Не совсем уверен, что произошло за кулисами, поэтому не могу предложить техническое объяснение, но, надеюсь, мое объяснение высокого уровня поможет кому-то в будущем.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .