1

В редакторе Sakura у вас может быть файл .txt с кодировкой UTF-8, который содержит 2 символа, которые недоступны в кодировке EUC.

Когда я сохранил .txt из UTF-8 в EUC в редакторе, все работает хорошо, и все символы отображаются правильно.

Кто-нибудь знает, какую логику использует редактор для этого?

1 ответ1

0

который содержит 2 символа, которые не доступны в кодировке EUC

Если вы видите два символа ÿþ (шестнадцатеричный FF FE) или þÿ (шестнадцатеричный FE FF) в начале первой строки, то файл кодируется в UTF-16, а не в UTF-8. Эти символы фактически являются « меткой порядка байтов » (BOM), которую редактор должен интерпретировать, а не показывать.

(На тот случай, если вы видите три символа  , представляющие собой шестнадцатеричный код EF BB BF в начале первой строки, то это спецификация для UTF-8. Если вы видите другие символы или нет в начале первой строки, можете ли вы отредактировать свой вопрос, чтобы добавить пример?)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .