2

Наши пользователи испытывают очень обескураживающую проблему в отношении того, как MS Word (в Windows) обрабатывает символы, отличные от Юникода. Эта проблема подтверждается как в Word 2007, так и в Word 2010 Beta с использованием Windows XP SP3; Я подозреваю, что это работает так же, как в 2003 году.

Выпуск:

  1. Пользователь создает документ, используя шрифт не-Unicode, вводя символы для представления научных обозначений. Например, он вводит Mu (µ). Примечание: для справки я вставил му, совместимый с юникодом.
  2. Пользователь открывает свой документ и пытается скопировать / вставить этот не-Unicode символ, представляющий Му, в веб-браузер для входа в нашу систему. Он вставляется как непризнанный персонаж. Это ожидается.
  3. Пользователь открывает свой документ, выбирает не-Unicode символ и настраивает его шрифт на "Arial Unicode MS", сохраняя документ. Он закрывает / повторно открывает документ для хорошей меры. После повторного открытия он копирует код Unicode Mu и вставляет его в веб-браузер. Он все еще представлен как непризнанный персонаж.
  4. Пользователь создает новый документ, устанавливает шрифт "Arial Unciode MS" и создает Mu. Он копирует этот Mu в веб-браузер и вставляет его в Unicode, как и ожидалось.

Заключение:

Word на самом деле не преобразует не-Unicode-символы в Unicode-символы, когда это необходимо, когда выбран шрифт Unicode. Вместо этого он принимает предположение по причинам отображения, но не выполняет фактического преобразования.

Как мне преодолеть эту проблему?

  • Могу ли я изменить некоторые настройки в Word для принудительного преобразования? Предпочтительнее.
  • Есть ли "чистое" приложение или макрос Word, который будет делать это?
  • Другие решения?

Дополнительные примечания:

  • Повторный ввод затронутых документов с использованием Unicode не вариант
  • Это не проблема в Mac OS X, использующей самую последнюю версию Word. Пример примера, такой как (3), приводит к вставке юникода Mu в браузер.

Пожалуйста помоги!

2 ответа2

2

Попробуйте использовать Paste Special ; должна быть опция для текста Unicode.

Обратите внимание, что если исходный документ был создан шрифтом Symbol, это не поможет. Windows на самом деле не знает, что символ связан с определенным символом Unicode, шрифты символа были созданы до Unicode как способ удовлетворения потребности, и эти два не являются взаимозаменяемыми.

1

Длительный процесс, но я обычно конвертирую такие файлы в изображения, а затем обрабатываю эти изображения с помощью любого программного обеспечения для распознавания текста. Что помогает. Но я сам искал еще лучший вариант.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .