Набор символов Unicode содержит концепцию объединения символов :
объединяющие символы - это символы, предназначенные для изменения других символов
При копировании вышеуказанного текста и его отображении с помощью notepad++, вы получите:
Текстовая строка содержит не менее 38 символов, большинство из которых являются комбинирующими.
Например, можно найти символ КОМБИНИРОВАНИЕ ЛЕВОЙ ПОЛОВИНЫ КОЛЬЦА, который выглядит следующим образом:
Эти комбинирующие символы, в основном предназначенные для использования на сложных азиатских языках, также можно творчески использовать в качестве украшения для латинских символов, что и было сделано здесь.
Из Unicode 6.2, глава 2:
Все комбинирующие символы могут быть применены к любому базовому символу и, в принципе, могут использоваться с любым сценарием. Как и в случае с другими символами, выделение символа объединения одному или другому блоку идентифицирует только его основное использование; он не предназначен для определения или ограничения диапазона символов, к которому он может быть применен. В стандарте Unicode разрешены все последовательности кодов символов.
Это не создает обязательство для реализаций поддерживать одинаково хорошо все возможные комбинации. Таким образом, хотя допускается применение арабской аннотации к ханскому символу или согласному деванагари, маловероятно, что оно будет хорошо поддержано при воспроизведении или имеет какой-либо смысл.