Мне нужно конвертировать некоторые файлы на греческом языке, которые закодированы для использования со шрифтом «Symbol» в Unicode. Могу ли я использовать iconv для этого? И если да, то как называется кодировка, которая используется в «Symbol»?
2 ответа
Возможно, вас ждет тяжелая поездка. В оригинале Symbol использовал нестандартный набор символов, который по существу был составлен для шрифта, выделяя символы для кодовых точек ASCII визуальным сходством с символами латинского алфавита; с описанием http://unicode.org/Public/MAPPINGS/VENDORS/ADOBE/symbol.txt описания того, как эта кодировка сопоставляется с Unicode, вы можете ознакомиться с ней.
Я полагаю, может быть сложно убедить iconv сделать то, что вы хотите - вам, возможно, придется прибегнуть к некоторой работе сценариев, чтобы напрямую транскодировать каждый символ.
Вы можете использовать онлайн-конвертер, найденный на этом сайте:
Символ шрифта в конвертер Unicode.
Эта статья содержит длинный список конвертеров, где автор «собрал все конвертеры греческих шрифтов, которые мне известны» (но я не знаю, какой из них рекомендовать):
Преобразователи греческого наследия в Unicode.
В противном случае вам, вероятно, придется создать свой собственный инструмент конвертации.
В статье « Преобразовать символ в юникод» в основном рассматриваются файлы HTML, которые представляют, например, символ Ω
через:
<font face="symbol">W</font>
Статья содержит исходный код для программы, которая конвертирует такие HTML-файлы, написанные на каком-то неопознанном языке программирования.
Другая такая статья - Как преобразовать шрифт Symbol в стандартную HTML-сущность utf8.
Иначе, один слишком простой метод может состоять в том, чтобы использовать какой-нибудь текстовый процессор, чтобы просто выделить текст и изменить его шрифт, но, вероятно, он слишком прост для работы.
Вы можете опубликовать минимальный пример файла, который поможет нам понять, какой тип конверсии требуется.