Когда дефис в кодировке UTF-8 (U+2010) копируется из браузера (я пробовал Firefox и IE), а затем вставляется в такие программы, как Putty и Vim (варианты Windows), все дефисы отображаются как «неизвестные глифы» , Вставка в блокнот работает без нареканий. Копирование / вставка в Debian / wheezy того же самого текста HTML (копирование из iceweasel, вставка в vim) также работает как ожидалось.

Но персонаж utf-8 не поврежден. Сохранение на диск соотв. копирование и вставка искалеченного текста работает как задумано.

Реальная проблема, которую я должен решить, - это Confluence и его функция экспорта в файл docx. HTML отображается нормально, docx показывает неподписанные глифы, копирование из docx в Блокнот показывает дефисы в вставленном тексте.

Что я мог сделать, чтобы решить это?

1 ответ1

0

Я провел дальнейшее исследование и нашел объяснение: Hyphen U+2010 НЕ содержится в большинстве шрифтов, особенно в фиксированных шрифтах, которые обычно необходимы в таких программах, как Vim и PuTTY.

Таким образом, решение моей проблемы Confluence заключается в следующем: при конвертации содержимого вики Confluence в формат файла MS Word выберите «Arial Unicode MS Standard» в качестве шрифта по умолчанию.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .