1

У меня есть этот PDF-файл

https://www.dropbox.com/sh/thhjvtlzebe20ab/AADVLBVntblYi4Nyi_SlXVRNa?dl=0

который содержит английский и арабский язык. Я хочу преобразовать его в файл .docx, и есть много способов, но ни один из них не дает отличных результатов.

  • Если я открою файл PDF с помощью MS Office 2016, я получу правильное форматирование, и все арабские буквы будут преобразованы правильно. Но я теряю почти все фигуры / рисунки, которые есть в документе.
  • Если я преобразую файл PDF в файл .docx, я получу все фигуры / рисунки, но затем получу кучу разрывов страниц, разрывов разделов, разрывов столбцов и т.д., И, кроме того, 70% арабских слов не будут правильно преобразованы.
  • Я могу избавиться от разрывов, используя код VBA, и я могу исправить большинство плохо преобразованных арабских слов, используя другой код, но все еще остается много слов, где я должен исправить их вручную.
  • Использование Google Docs дает кучу беспорядка.
  • Использование Abbyy Finereader также приводит к путанице слов.

Некоторая полезная информация:

  • Этот файл был создан с использованием MS Office Word 2013. Я потерял исходные файлы, потому что мой жесткий диск сломался и делал только резервные копии файлов PDF. У всего есть тот же шрифт, который (раз новый римский)

Изменить: я использовал Adobe Acrobat Pro для преобразования из PDF-файла в. DOCX файл

Если я просто скопирую и вставлю арабские слова из pdf в документ word, используя опцию вставки "только текст", я получу почти идеальные результаты. Но у меня есть более 250 страниц, и это займет время, которого у меня нет.

1 ответ1

1

Я опробую этот онлайн-конвертер https://pdf2doc.com/it/

Конвертируйте файл из PDF в DOC и откройте его с помощью libreoffice, чтобы получить приемлемый результат (в большинстве случаев нужно настроить только нумерацию страниц).

вот результат: https://1drv.ms/f/s!Aj15LBU4peCjmZZp1BZZ7l9hwC3cqg

в любом случае преобразование не может быть выполнено на 100% из-за проприетарного формата пакета Office, поэтому по этой причине, если вы используете сторонний конвертер, наконец, теряете формат, откройте документ, который я предоставляю вам libreoffice со словом 2016, результат не так хорошо.

снимок экрана с файлом doc, открытым из libreoffice и word 2016:

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .