Не удается скопировать текст из файла PDF

Question

Я использую foxit PDF Reader для просмотра моего учебника. Я хотел бы скопировать текст из PDF-файла в текстовый документ, но он не позволит мне. Я могу выбрать текст хорошо, но опция для копирования текста недоступна. Я могу скопировать текст из других документов, но не некоторые. Есть ли способ обойти эту защиту в окнах?

score 28 · Accepted Answer · 2011-03-09T19:38:42

Возможно, PDF-файл заблокирован от копирования текста. Ниже приведены два способа разблокировки:

Если PDF-файл не был заблокирован для печати, вы можете распечатать его на виртуальном PDF-принтере, чтобы создать разблокированный файл. Видеть это:
«Удалить пароль и разблокировать защищенный PDF, который разрешается печатать, не зная секрета».
Если функция печати была заблокирована, посмотрите это:
«Снять ограничения и расшифровать защищенные паролем PDF-файлы с помощью PDF Unlocker».

score 24 · Answer 2 · 2011-03-09T19:38:42

Откройте PDF в Google Chrome(перетащите PDF-файл в Chrome).
Распечатайте определенную страницу в формате PDF или просто откройте предварительный просмотр.
Теперь вы можете скопировать текст из предварительного просмотра или вывода PDF. Но я не думаю, что вы могли бы скопировать таблицу напрямую.

score 10 · Answer 3 · 2011-03-09T19:38:42

Мне удалось создать версию PDF-файла без DRM, используя Ghostscript (который доступен для Windows).

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

Полученный файл stripped.pdf можно загрузить в Adobe Reader, и Reader с радостью позволит вам скопировать любую его часть по вашему желанию. Это также сохраняет большую часть форматирования таблицы.

score 2 · Answer 4 · 2011-03-09T19:38:42

Я смог успешно скопировать таблицу из вашего PDF-файла, используя Okular (для Linux; часть KDE). Чтобы сделать это, мне нужно было зайти в настройки Okular и снять галочку «Сдерживать ограничения DRM».

Я знаю, что это не очень вам помогает, так как вы работаете с Windows, но это возможно, если у вас есть машина с Linux под рукой или вы хотите ее установить.

К сожалению, это был простой текст без форматирования, но похоже, что воссоздать таблицу не составит большого труда. Вы можете увидеть результаты моего копирования и вставки приключений здесь.

score 1 · Answer 5 · 2011-03-09T19:38:42

Вы можете использовать GT Text - программу, которая переводит изображения (также снимки в формате pdf = изображение) в текст. Вы можете выбрать область и скопировать ее в буфер обмена. Это бесплатно.

Официальная домашняя страница http://gttext.googlecode.com

score 0 · Answer 6 · 2011-03-09T19:38:42

Другая возможность - Evince.

В Windows, кажется, поддерживает копирование по умолчанию.

В Linux копирование можно включить, проверив настройку override_restrictions если это еще не сделано, следуя этим указаниям (dconf-editor → /org/gnome/evince → override_restrictions).

score 0 · Answer 7 · 2011-03-09T19:38:42

Это удалось преобразовать основной текст. Это изобиловало таблицами, хотя.

http://www.onlineocr.net/documents

score 0 · Answer 8 · 2011-03-09T19:38:42

Если вы просто ищете короткие фрагменты, вы часто можете ввести несколько слов в Google внутри кавычек и найти точную цитату, уже отсканированную в другом формате или набранную кем-то другим.

Другой вариант - "Документ из фотографии" в приложении Google Docs для Android, в котором текст вводится через OCR. Это подвержено ошибкам, конечно.

Я бы хотел, чтобы функциональность блокировки PDF никогда не существовала. :(

score 0 · Answer 9 · 2011-03-09T19:38:42

Ответ эндолиту:

Ваш PDF защищен от копирования, но не защищен от печати.

Поэтому я распечатал одну страницу, содержащую таблицу 6.15, в другой PDF-файл, который не защищен от копирования, выделил и скопировал таблицу, а затем вставил ее в Word. К моему большому удивлению, результатом пасты стал полный мусор.

Теперь я еще раз взглянул на эту таблицу и нашел очень удивительный результат:это не таблица!

Это на самом деле монтаж небольших фрагментов текста, расположенных на странице так, чтобы они выглядели как таблица. Но это не настоящая таблица.

Лучшее, что вы можете сделать, это либо переписать все это в виде таблицы, либо просто использовать в своей работе скриншот этого табличного текста.

Вот мой скриншот таблицы, взятый из моего сгенерированного одностраничного PDF-документа :

образ

Сейчас выбран русский

Не удается скопировать текст из файла PDF

9 ответов9

Всё ещё ищете ответ? Посмотрите другие вопросы с метками pdf copy-paste copy-protection.

Связанные

Не удается скопировать текст из файла PDF

9 ответов9

Всё ещё ищете ответ? Посмотрите другие вопросы с метками pdf copy-paste copy-protection.

Связанные

Похожие