9

Японский (日本語) - 0123456789

Типичный ASCII для всех остальных мест - 0 1 2 3 4 5 6 7 8 9

Почему возникла необходимость создать отдельный набор символов для одних и тех же цифр?

3 ответа3

11

Это символы полной ширины.

  • Эти символы, которые находятся в Unicode U+FF00 до U+FFEF, предназначены для использования с символами CJK. Они существуют так, что латинские символы могут совпадать с текстом CJK фиксированной ширины. Исторически символы Хань были установлены в ширину двойного размера в терминалах 80x24, и эти символы использовались для соответствия ширине текста CJK.

  • Эти символы не ограничиваются цифрами. Полный латинский алфавит доступен в полном формате.

    ABCDEFGHIJKLMNOPQRSTUVWXYZ
    abcdefghijklmnopqrstuvwxyz
    0123456789
    

Командная строка в Windows, показывающая формы полной ширины для латинских символов наряду с символами Хань
Источник изображения

3

Эти символы полной ширины предназначены не только для японского, но также для корейского и китайского языков, поскольку они имеют набор символов двойной ширины (или полной ширины). Из-за их визуальной сложности и плохого разрешения экрана в прошлом физически было невозможно отобразить эти языки в виде символов половинной ширины - особенно для корейских и китайских символов.

(Японский язык также имеет символы половинной ширины, но на японском языке довольно редко используются только японские символы. В основном это смешанные китайские иероглифы. Так что наличие символов полуширины не очень помогает.)

Эти большие числовые символы были введены для этого. Когда они писали, например, таблицу или текст в виде сетки без использования графики, типичные числовые символы плохо смешивались. Кроме того, у них были культуры "вертикального письма", а также горизонтальное письмо, которое мы используем сейчас. Представьте себе, если вы пишете эти символы вертикально, обычные числовые символы, вероятно, будут выглядеть некрасиво при смешивании.

Аналогичные вещи происходили и на стороне структуры данных, потому что символы половинной ширины занимали 1 байт каждый, а символы полной ширины - 2 байта или более.

Заставить большинство персонажей занимать одно и то же место, и память сделала такие вещи проще. Точно так же есть полноформатные латинские символы.

Я вроде понимаю, почему вы задали этот вопрос - в настоящее время все на GUI. Таблицы больше не написаны в тексте. Вертикальные письма становятся устаревшими. Чтобы иметь более широкие символы, мы можем просто отрегулировать ширину вместо использования жирных символов. Большинство символов в любом случае занимают несколько байтов, поскольку вводятся более сложные кодировки. Поэтому, возможно, это правда, что эти буквенно-цифровые символы полной ширины являются своего рода наследием от старости, как клавиша "Scroll Lock" на клавиатуре.

0

Я считаю, что это связано с шириной символов, и японский является одним из тех языков, где вы можете печатать вертикально.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .