2

Просматривая онлайн сегодня, я наткнулся на следующий URL:

http://d§.cc/

Как-то это работает. В Firefox 3.6/Mac браузер интерпретирует URL как:

http://xn--d-jca.cc/

В Safari 5/Mac URL-адрес не изменяется при переходе к нему.

Я всегда понимал, что символ § (знак раздела), среди прочего, недопустим в URL. Процитируем RFC 1738:

Таким образом, только буквенно-цифровые символы, специальные символы "$ -_.+!* '(), "и зарезервированные символы, используемые в зарезервированных целях, могут использоваться без кодирования в URL-адресе.

Это странность кодировки символов? И как / где я могу зарегистрировать свой собственный § URL?

2 ответа2

12

Это интернационализированное доменное имя или IDN. Используемая кодировка называется punycode.

Многие крупные регистраторы занимаются продажей доменных имен IDN, включая GoDaddy, но когда я зарегистрировал свой тщеславный IDN (ə.tv), я обнаружил, что Name.com проще. Они стоят столько же, сколько "обычные" домены.

Ниже приведен список допустимых символов IDN - однако учтите, что многие из этих символов не будут отображаться правильно во всех шрифтах, поэтому, если вы хотите купить IDN, убедитесь, что вы тестировали его в часто используемых шрифтах на вашем компьютере. целевые платформы перед покупкой.

1

Это называется IDN (интернационализированное доменное имя). Это не имеет ничего общего с URI, это особенность DNS (Domain Name System), которая преобразует понятные человеку DNS-имена, такие как www.example.com в IP-адреса, такие как 127.0.0.1 .

Поскольку изначально система доменных имен была только ASCII, IDN была введена обратно совместимым образом: DNS-имена, содержащие символы не-ASCII, кодируются в DNS-имена, содержащие только символы ASCII, с использованием алгоритма Punycode, который специально разработан для эффективен для типов строк, которые обычно содержатся в DNS-имени и при этом могут быть несколько удобочитаемыми даже в закодированном виде.

Основная цель IDN, как следует из названия, состоит в том, чтобы сделать возможным регистрацию доменных имен на языках, отличных от английского. Однако побочным эффектом является то, что теперь все имена Unicode, включая символы, которые на самом деле не имеют ничего общего с неанглийскими языками, могут использоваться в доменных именах.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .