Я пытаюсь выделить слова в документе PDF. Однако за словами написано большими буквами "НЕ КОПИРОВАТЬ" по всему документу. Иногда, когда я пытаюсь выделить слова, вместо них выделяются те большие буквы. Как я могу выделить слова, которые я хочу, вместо этих больших букв на заднем плане?
7 ответов
Это было бы хорошо попробовать:
- Откройте PDF
- Выбрать все, Скопировать
- Вставить в текстовый процессор, такой как Word
- Используйте встроенную функцию « Найти и заменить», чтобы найти « НЕ КОПИРОВАТЬ » и заменить ее ничем.
Ваш PDF-документ может быть защищен для того, чтобы сделать его не копируемым .. так что это может быть проблемой. Во-вторых, этот текст также может быть водяным знаком ... который можно удалить из программного обеспечения для создания PDF-файлов, такого как Adobe Acrobat proffessional или NitroPDF.
для снятия ограничений вы можете использовать такие сервисы, как http://freemypdf.com/... но удаление ограничений из PDF может быть незаконным, как это также предупреждается на этом сайте .. так что это зависит от содержимого PDF.
Удачи..
Большие буквы с надписью "НЕ КОПИРОВАТЬ", вероятно, были добавлены, чтобы остановить выделение текста и его копирование в буфер обмена.
Это также затруднит выделение текста и его выделение.
Может быть достаточно начать выделение с другой точки.
Попробуйте выделить с конца отрывка, а не с начала, или чуть раньше текста, который вас интересует.
Похоже, что вы хотите удалить водяной знак, сохраняя файл в формате PDF.
В Интернете я нашел файл с тем же фоновым изображением "Не копировать", и, хотя он не мешает вам выбирать / выделять текст, он иногда может быть немного сложным.
Чтобы не изобретать велосипед, здесь представлены три решения (у вас еще есть PDF в конце) и обходной путь (у вас есть серия изображений):
- Из исходного документа воссоздайте PDF без водяного знака (да, ну, я не думаю, что это применимо, не так ли?);
- установить Adobe Acrobat (не Reader) даже в пробной версии и использовать его для удаления водяного знака;
- преобразуйте PDF-файл в файл Word, удалите водяной знак, а затем снова экспортируйте его как PDF-файл (результат действительно зависит от форматирования и содержимого вашего PDF-файла);
- конвертировать PDF в изображения и удалить водяной знак вручную (может быть, немного работы).
Какой из них лучше, зависит, вероятно, от количества файлов, из которых вы хотите удалить водяной знак, и от того, является ли это условной потребностью или чем-то, что вы будете делать день за днем. Если это только один раз, то я предлагаю попробовать решение Adobe Acrobat, упомянутое в связанном блоге.
Если вы не можете скопировать, потому что это "зашифровано" и разрешения не позволяют, просто используйте программу для удаления паролей PDF. Однако не существует каких-либо простых в использовании бесплатных программ, о которых я знаю. Даже большинство PDF-программ с открытым исходным кодом обеспечивают бессмысленную чепуху. (хотя pdftotext не волнует, и позволяет вам вывести PDF в текст).
Для собственного использования я изменил источник pdftk, чтобы не проверять ограничения. Недавние обновления библиотеки, основанные на ней, заставили меня заново сделать это изменение, которое я пока не получил, чтобы начать работать, или я бы опубликовал патч.
Вы можете использовать бесплатный PDF Reader, который знает, как извлечь текст:
Просмотр PDF-XChange :
Может извлекать текст из PDF-страницы / файла.
Foxit Reader :
Можно преобразовать весь документ PDF в простой текстовый файл.
Оба эти читателя быстрые и простые в использовании.