2

ОС:WinXP

Скажем, у меня есть несколько файлов на китайском и некоторые файлы на корейском. И в окнах «Region and Language Options» я установил язык для не-Unicode программы = китайский. Можно ли как-нибудь легко прочитать какой-нибудь корейский текстовый файл в текстовом редакторе без использования Microsoft Word?

Мне нужна среда, которая может легко поддерживать несколько юникодов, мне нужно читать китайский, японский, корейский языки в текстовом редакторе (Ultraeditor, notepad++) и терминальные клиенты, такие как SecureCRT. Пожалуйста, посоветуйте, спасибо.

Еще один быстрый вопрос: как Word распознает какой язык в текстовом файле? Есть ли какая-либо информация в тексте?

3 ответа3

1

Я не думаю, что есть какой-нибудь пейлин, который поддерживает множественное кодирование.

Notepad ++ не может отображать несколько закодированных данных в одном файле.

Но очень возможно, что вы можете использовать разные языки в одном и том же текстовом файле. Но это должна быть та же самая кодировка.

Как пример
日本 это по-японски বাংলাদেশ это бенгальский. 한국 (я думаю, что это корейский)

Но все использовали одну и ту же кодировку (в данном случае UTF-8)

И, конечно, браузер, который вы используете, не может отображать две кодировки одновременно.

если у вас есть идея развития. Вы можете попробовать простой тест на проблему кодирования. Попробуйте напечатать два разных закодированных данных на одной странице. вы получите вывод мусора.

Но если у вас может возникнуть довольно интересная проблема, когда вам будет казаться, что вы получаете данные в другой кодировке ... как пример

скажем у вас есть два разных текстовых файла с двумя разными кодировками. 1. UTF-8 2. SHIFT-JIS

оба содержат японский текст. Если вы скопируете некоторый текст из одного текстового файла и вставите его в другой, вы увидите успешное вставление. Вы должны спросить, что они отличаются кодировкой, почему они вставляются в один и тот же текстовый файл?

Ответ: когда вы копируете какой-то текст, он копируется в UNICODE, а также вставляется как Unicode (с моим небольшим знанием программирования весь текст, отображаемый в окнах, находится в Unicode. Если вы не конвертируете текст в Unicode, вы не сможете их правильно распечатать). Но когда пользователь сохраняет файл, он сохраняется в правильной кодировке ....................

1

По первому вопросу вы можете попробовать утилиту Microsoft AppLocale

http://www.microsoft.com/downloads/details.aspx?familyid=8C4E8E0D-45D1-4D9B-B7C0-8430C1AC89AB&displaylang=en

Я не пользователь Word, но я предполагаю, что когда документ сохраняется с заданной кодировкой, кодовая страница для языка сохраняется как часть метаданных документа.

1

Скажем, у меня есть несколько файлов на китайском и некоторые файлы на корейском. И в окнах «Region and Language Options» я установил язык для не-Unicode программы = китайский. Можно ли как-нибудь легко прочитать какой-нибудь корейский текстовый файл в текстовом редакторе без использования Microsoft Word?

Да, вам нужно использовать редактор, который поддерживает несколько кодировок. Большинство полнофункциональных редакторов (notepad++, (g)vim и т.д.) Поддерживают это. Обычно вам нужно сообщить редактору, какая кодировка имеет текстовый файл (поскольку эта информация отсутствует в самом файле), хотя иногда редактор может угадать это для вас. Например, в Notepad++ и gvim есть настройки меню / конфигурации для выбора кодировки.

Мне нужно читать китайский, японский, корейский в текстовом редакторе (Ultraeditor, notepad++) и терминальных клиентах, таких как SecureCRT. Пожалуйста, посоветуйте, спасибо.

Для чтения в текстовых редакторах, см. Выше. Что касается "SecureCRT": я предполагаю, что вы имеете в виду файл на удаленном сервере, к которому вы обращаетесь через SecureCRT. Затем вам нужно использовать редактор на удаленной системе, который поддерживает кодировку файла.

Еще один быстрый вопрос: как Word распознает какой язык в текстовом файле? Есть ли какая-либо информация в тексте

Для простых текстовых файлов, как правило, вы не можете указать кодировку. Тем не менее, вы можете догадаться (в основном на основе частоты байтов); это, вероятно, то, что делает Word.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .