Я знаю, что в Западной Европе и США CP-1252 является кодировкой символов по умолчанию.

Как насчет кодировки символов по умолчанию в других версиях Windows?

Кроме того, недавно я слышал, что Windows 8 использует UTF-8 в качестве кодировки символов по умолчанию, это правильно?

1 ответ1

3

Windows по своей природе использует кодировку UTF-16. «Кодировки по умолчанию» или «кодовые страницы по умолчанию» в терминологии Microsoft - это просто устаревшие кодировки, которые используются многими старыми программами. Например, в Блокноте кодировкой по умолчанию при сохранении файла является «ANSI», которая (скорее обманчиво) обозначает кодовую страницу по умолчанию (но Блокнот внутренне работает с UTF-16).

Системный языковой стандарт определяет кодовую страницу по умолчанию. Страница Windows Locale Codes - Сортируемый список показывает отображение и, вероятно, является надежной. (Мне не удалось найти страницу Microsoft по этому вопросу.)

В частности, веб-браузеры, как правило, используют кодовую страницу по умолчанию, определяемую как кодирование веб-страницы, если информация о кодировке недоступна. На самом деле все сложнее. В HTML5 LC раздел Определение кодировки символов описывает (и предписывает) процесс, а также содержит таблицу сопоставлений, которая в значительной степени отражает сопоставления Windows от локалей до кодовых страниц.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .