Я работал над документом Microsoft Word в формате .docx, и когда я нажал «Сохранить», чтобы сохранить документ, все символы были преобразованы в неизвестные символы, по крайней мере, мне не знакомые символы, потому что они выглядят как азиатские буквы. Вот часть преобразованного документа:
ࠀ ࠚ ࠛ ࠜ ࠼ ࠽ ࡦ ࢄ ࢢ ࣫ ँ ः त ृ क़ ख़ ग़ 뗇뗇醣楿坿㍅㍅ ᘢ⸲䌀ᡊ伀͊儀͊帀͊愀ᡊ洀᱈猄᱈ ᘢ镤䌀ᡊ伀͊儀͊帀͊愀ᡊ洀᱈猄᱈ ᘢ鱨䥓䌀ᡊ伀͊儀͊帀͊愀ᡊ洀᱈猄
Что я пробовал до сих пор:
- Передал часть этого текста в Google Translate. Google был в состоянии обнаружить несколько языков в тексте, таких как хинди и китайский.
- Сохранено .docx в виде простого текстового файла. Было несколько вариантов кодирования на выбор. Я попробовал их все из следующего диалогового окна, но не нашел решения:
Кажется, что .docx имеет нормальный размер 85 кбайт для того объема контента, который у него был, поэтому я не думаю, что какой-либо контент был потерян. Более подробная информация: мне не хватило места на локальном диске.
- Операционная система: Windows XP
- Версия Microsoft Word: 2007
Итак, вопросы: что произошло в фоновом режиме, что заставило обычный текст преобразовываться в такие символы и как получить его содержимое? Я чувствую, что документ docx был связан с каким-либо другим форматом файлов, и теперь Word не может его прочитать.
Я прилагаю документ к этой ссылке, если это поможет: https://www.dropbox.com/s/858v143ebqgdeij/AL-P0122074.docx?dl=0