Я пытаюсь скопировать текст из PDF в Excel. Проблема в том, что PDF защищен паролем, отключив функцию копирования. Текст можно легко скопировать с помощью средства просмотра Windows XPS, Onenote и других методов. Мне нужно, чтобы PDF оставался в формате PDF, потому что у меня есть программа, которая извлекает данные из PDF. Поэтому моей первоначальной идеей было открыть защищенный PDF-файл и распечатать его как другой PDF-файл для копирования текста.
Поэтому я попытался ответить на предыдущий вопрос: как удалить защиту из файла PDF?
И он несколько раз публиковался в Интернете, поэтому я предполагаю, что он работает для других. Однако, когда я удаляю все, начиная с «mark currentfile eexec ... cleartomark», сохраняю и перегоняю в Adobe, я получаю сообщение об ошибке от дистиллятора Adobe:
%%[ Error: undefined; OffendingCommand:  ]%%
%%[ Flushing: rest of job (to end-of-file) will be ignored ]%%
%%[ Warning: PostScript error. No PDF file produced. ] %%
Я пытался исследовать ошибку, но команда OffendingCommand: «» кажется не очень популярной.
Шаги, которые я предпринял для этого процесса:
- Открыть защищенный паролем PDF
- Выберите драйвер печати PDF, проверьте печать в файл
- Файл .ps создан. Я использовал Блокнот, чтобы открыть и отредактировать файл .ps и удалить текст «mark currentfile ... cleartomark».
- Сохранить
- Двойной щелчок по файлу автоматически запускает Adobe Distiller, и я получаю сообщение выше.
Любая помощь в том, что я делаю не так? Или другие идеи? Я не могу попробовать стороннее программное обеспечение для полного удаления пароля.
PS Я читал, что Adobe, пытаясь напечатать файл, создает временный файл, который иногда можно переименовать в «.pdf», чтобы сделать его PDF. Будет ли это применимо в этом случае? В какой папке Temp это будет? Я попытался найти свой компьютер, но не смог найти файл / файлы одинакового размера, которые я пробовал, не помогло.