50

Есть ли быстрый и простой способ найти кодовую точку Unicode для любого символа? Например, я вижу забавного персонажа на веб-странице, или в файле PDF, или в каком-то другом документе.

В настоящее время я копирую символ в буфер обмена, сохраняю его в файл и просматриваю файл с помощью шестнадцатеричной программы просмотра. В качестве альтернативы я могу открыть Microsoft Word, вставить и сделать Alt+X. Оба эти метода немного громоздки. Есть ли более простой способ?

Я использую Notepad++, поэтому, если есть какой-то способ сделать это с помощью Notepad++, это будет подходящий ответ (он менее громоздок, чем необходимость открывать Word). Или, может быть, есть способ сделать это с помощью небольшого специализированного приложения?

14 ответов14

33

Notepad++ имеет предустановленный плагин, называемый Converter, который имеет возможность конвертировать ASCII в HEX и наоборот. Этот инструмент очень полезен для преобразования файлов данных в формате HEX, которые должны быть преобразованы в ASCII, для чтения:

Вот как это работает:

31

Я много работаю с символами Unicode, поэтому специально для этого я написал небольшое приложение для Windows:

Unicode Character Informer (Документация)

Кроме того, мой текстовый редактор Rejbrand Text Editor имеет обширную поддержку символов Unicode.

17

Когда я сталкиваюсь с этой проблемой, быстрый поиск в Google обычно дает быстрый ответ. Например, когда я гуглю "юникод", я получаю такой результат: Поиск Google для "смайлика с глазами в форме сердца"

Мне нравится этот метод, потому что:

  • Работает на любом компьютере с интернетом
  • Вам не нужно ничего устанавливать
  • Необходимые нажатия клавиш (Ctrl+C и Ctrl+T & Ctrl+V & Enter) являются действиями мышечной памяти для меня и, вероятно, для большинства других разработчиков / машинисток.
9

В Unix-подобной системе *:

unicode -s "$(xsel -ob)"

Вы можете создать псевдоним этого или создать скрипт для его запуска.

Вывод выглядит так:

U+2672 UNIVERSAL RECYCLING SYMBOL
UTF-8: e2 99 b2 UTF-16BE: 2672 Decimal: ♲ Octal: \023162
♲ (♲)
Uppercase: 2672
Category: So (Symbol, Other)
Bidi: ON (Other Neutrals)

* Похоже, что оригинальный постер, вероятно, использует Windows, но (а) это не указано, и (б) это решение может помочь другим.

8

Есть хороший маленький сайт под названием Unicode Character Inspector (созданный Тимом Уитлоком), который делает именно это. Я нахожу это более удобным, чем текстовый редактор или настольная программа.

6

Вы можете использовать PowerShell!

[char]::ConvertToUtf32((gcb), 0)

Это печатает первую кодовую точку Unicode текста в буфере обмена.

Если вам не нужно беспокоиться о символах вне Базовой многоязычной плоскости (которые будут представлены в строках .NET как суррогатное с высоким и низким суррогатом), вы можете использовать это вместо:

[int](gcb)[0]

Если вы предпочитаете его в шестнадцатеричном формате , вы можете использовать спецификатор формата:

'0x{0:x}' -f [char]::ConvertToUtf32((gcb), 0)
5

Примечание для любых пользователей Emacs: вы можете набрать C-u C-x = и он даст вам кучу информации о символе под курсором, включая кодовую точку Unicode, имя в базе данных Unicode, категории и т.д.

             position: 146 of 147 (99%), column: 0
            character: ♲ (displayed as ♲) (codepoint 9842, #o23162, #x2672)
    preferred charset: unicode (Unicode (ISO10646))
code point in charset: 0x2672
               script: symbol
               syntax: w    which means: word
             category: .:Base
             to input: type "C-x 8 RET 2672" or "C-x 8 RET UNIVERSAL RECYCLING SYMBOL"
          buffer code: #xE2 #x99 #xB2
            file code: #xE2 #x99 #xB2 (encoded by coding system utf-8-unix)
              display: by this font (glyph code)
    xft:-PfEd-Mensch-normal-normal-normal-*-16-*-*-*-m-0-iso10646-1 (#x985)

Character code properties: customize what to show
  name: UNIVERSAL RECYCLING SYMBOL
  general-category: So (Symbol, Other)
  decomposition: (9842) ('♲')
3

Есть Вим? Просто вставьте его, наведите на него курсор и нажмите ga . Я использую это все время для странных персонажей.

2

Я использую http://unicode.scarfboy.com, который прост и работает хорошо.

2

Я считаю, что конвертер кодов Unicode Ришарда Ишиды (ссылка на GitHub) очень полезен, среди прочего, для поиска кодов Unicode . Он также обеспечивает переводы / преобразования в другие кодовые точки, кодировки и, например, escape-последовательности.

Unicode Converter

Вы также можете зайти на главную веб-страницу Ричарда Ишиды (rishida.net), поскольку она содержит (ссылки на) множество ценных инструментов и информации, особенно если вы заинтересованы в интернационализации и кодировке символов. Например, другой очень полезный инструмент, связанный там, это его инструмент Uniview (ссылка на github).

UniView

И, наконец, очень полезным, на мой взгляд, является, в основном, для пользователей Mac, программа MacOS Character Viewer, доступная через меню ввода, которое можно включить в « Системных настройках» → « Клавиатура».

Хотя сайт поддержки Apple в основном посвящен тому, как вставлять смайлики (…), просмотрщик символов на самом деле очень полезен для поиска определенных («специальных») символов и их кодовых точек в нескольких различных кодировках, а также для поиска того, какие Шрифты на вашей системе содержат определенные глифы.

Просмотрщик персонажей

Ура!

2

Вы также можете использовать следующий сайт: https://unicode-table.com/en/ Просто вставьте своего персонажа, и вы получите код Unicode и HTML-код.

1

Если у вас есть Microsoft Word, вставьте туда текст, выберите символ (или щелкните справа от него) и нажмите Alt+X.

0

Вот еще один ответ, используя идею от user202729:

Добавьте в закладки URL javascript:alert(prompt().codePointAt(0).toString(16)) и запустите его с помощью браузера. (Работает на Chrome и Firefox. Похоже, не работает на IE, но это может быть связано с настройками безопасности.)

В отличие от других ответов, не требуется подключение к Интернету, нет необходимости загружать внешнюю утилиту, не зависящую от ОС.

0

Я собираюсь упомянуть http://amp-what.com/, так как он действительно прост в использовании благодаря своему полю быстрого поиска и поддерживает различные нотации (& code, кодовые точки Unicode, последовательность символов кодирования URI).

Пример изображения

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .