У меня есть этот файл, который был экспортирован из программы DOS, как странный текстовый файл. Открывая его с помощью Microsoft Word, просит установить кодировку - я установил Hebrew(MS-DOS)

Файл отформатирован RTL, с большинством вещей правильно и на месте, но текст в обратном направлении.

Я попытался изменить выравнивание и прочее для него, но это не изменило его.

Назад означает: :לום записывается как םולש.

Есть ли способ заставить Word перевернуть все слова?

Я знаю, как работать с регулярными выражениями, поэтому я подумал, что, возможно, смогу заменить регулярное выражение, поэтому попробовал:

[א-ת|"|'|\.]*? это работает, если я копирую какой-то текст в блокнот, но не работает вообще на словах.

Сохранение файла в виде текстового файла приводит к странной кодировке.

1 ответ1

0

Я предполагаю, что кодировка текстового файла, созданного вашим приложением командной строки (программа DOS), не является ивритом (MS-DOS) (он же CP 862). Следовательно, когда вы открыли его с помощью Word и выбрали в качестве кодировки иврит (MS-DOS), он был прочитан неправильно. Это кажется правдоподобным, поскольку CP 862 хранит текст в визуальном порядке.

Если вы можете правильно определить кодировку символов "странного текстового файла", вы можете установить правильную кодировку при открытии его в Word, и результирующий текст должен выглядеть хорошо. Вы можете найти выходную кодировку в документации к вашей DOS-программе или обнаружить кодировку с помощью Notepad++ (хотя она может быть неправильной). В крайнем случае, вы можете просто попробовать открыть файл в Word и попробовать несколько разных, распространенных кодировок.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .