Я создал файл в notepad++, преобразовал его кодировку в Characterset-> Arabic-> ISO-8859-6

и скопировал и вставил текст на арабском языке, а затем закрыл файл.

но когда я снова открыл его, весь текст превратился в несколько странных символов, что-то вроде:

Ê?æ ??? åèÇÕäÇÊ? æØÇå¬

Я также открыл файл с помощью Microsoft Word и выбрал арабскую кодировку (Windows), но она также не работала.

Мне действительно нужны эти данные обратно. Я был бы очень признателен, если бы кто-нибудь мог сказать мне, как получить правильный текст обратно.

1 ответ1

0

Файл не был зашифрован. Он находится в кодировке ISO-8859-6, и Notepad++ не может его прочитать , хотя он и написал . Notepad++ может работать только с несколькими кодировками; большое меню для настройки кодировки предназначено только для вывода.

Microsoft Word может прочитать файл, но при открытии необходимо указать кодировку как арабскую (ISO). Это означает ISO-8859-6, который отличается от арабской кодировки Windows, windows-1256.

Кроме того, вы можете отредактировать файл в Notepad++ и добавить в начале следующие строки:

<!doctype html>
<title>Test</title>
<meta charset=iso-8859-6>

Затем сохраните его с расширением .html и откройте в веб-браузере. Теперь вы должны увидеть арабский текст, который вы можете скопировать и вставить.

Как еще один вариант, скачайте и установите редактор BabelPad . Его команда «Открыть» позволяет выбрать кодировку открываемого файла, в качестве альтернативы используется ISO-8859-6.

Примечание. В начале файла может быть три странно выглядящих символа, а именно метка порядка байтов (BOM) в кодировке UTF-8, в результате написания файла. Это отражает недостатки Notepad++.

В общем, лучше всего по возможности работать с UTF-8. Это тратит несколько байтов, но спасает проблемы.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .