Как мне представить символы Юникода с брайлевскими блоками? Вы можете кодировать символы ASCII, но как насчет Unicode? Я не видел никакой схемы для представления символов Unicode в Брайле.
3 ответа
В Брайле нет понятия Юникод. В этом смысле шрифт Брайля похож на старые 8-битные кодовые страницы, которые представляли разные символы на разных языках для одного и того же кода символа. Например, ⠟
означает Q
на английском языке и Ч
на русском языке Брайля.
Таким образом, ответ заключается в том, что нет способа представить Unicode в шрифте Брайля на индивидуальной основе. Технически вы, конечно, можете переводить последовательности Unicode, такие как U+025B
в ⠠⠥ ⠼⠚⠃⠑⠠⠃
и таким образом вы можете представлять любой символ Unicode, но я думаю, что это не то, что вам нужно.
Азбука Брайля зависит от языка. Первоначальная система Брайля была разработана для французского языка, а позже были разработаны различные варианты для других языков, чтобы соответствовать их различным репертуарам персонажей. Эти системы могут быть расширены по-разному, но на нем нет международных стандартов, вероятно, также нет национального стандарта. В каждой системе подавляющее большинство из более чем 100 000 символов Юникода не имеют рендеринга Брайля.
Существует сборник информации о различных используемых системах Брайля, который можно загрузить в формате PDF на веб-сайте World Braille Usage.
Преобразование простого текста (Ascii или Unicode) в шрифт Брайля является тонкой и сложной проблемой. Паттерны Брайля не являются буквами в традиционном смысле, поэтому не всегда существует прямое сопоставление персонажа с шаблоном Брайля. В зависимости от языка / алфавита переводимого сценария (и в некоторых случаях от контекста использования), у вас может быть несколько букв алфавита, представленных одним блоком Брайля, или один символ алфавита, представленный несколькими блоками Брайля. Значение каждого блока также может значительно различаться в зависимости от языка или алфавита.
Как упоминал Ян Догген, есть раздел стандартного Unicode, который представляет все шаблоны блоков Брайля (U+2800 ..U+28FF).
Пример сложностей; Вы можете увидеть некоторые специальные сокращения буквенных комбинаций в шрифте Брайля США 2 здесь, в коде библиотеки перевода с открытым исходным кодом liblouis:
https://code.google.com/p/liblouis/source/browse/trunk/tables/en-ueb-g2.ctb?spec=svn971&r=971
Если вам нужно перевести некоторый текст, лучше всего использовать уже существующий переводчик или библиотеку кодов:
http://libbraille.org/translator.php