1

Я видел файлы PDF, которые заблокированы, так что нельзя копировать текст из него, но можно выделить его. Я пробовал несколько программ для чтения PDF (некоторые из которых с открытым исходным кодом), и все они уважают блокировку. Это форма шифрования? Если да, как я могу выделить текст, но не скопировать его? Или это просто замок, который полагается на читателей?

Тот же вопрос для заблокированных файлов .ppt. Я даже не могу открыть их с помощью OpenOffice. С Powerpoint я могу открыть их как "только для чтения".

Опять же, действительно ли контент зашифрован? Если да, как я могу выделить текст, но не скопировать его? Как информация зашифрована, но видима и доступна для выбора? Я полагаю, если он был зашифрован, его нельзя выбирать, а нужно вписать в страницу, как изображение.

Итак, это пароль доступа, как при входе в Windows, это не имеет значения, если вы загружаетесь с другого диска? Или это реальное шифрование, где нельзя обойтись?

2 ответа2

2

Если вы не можете прочитать его, не указав пароль, он зашифрован. (Тем не менее, более ранние версии Office и Acrobat имели очень слабые алгоритмы. Современные версии, как правило, используют AES.)

Если вы можете прочитать его без пароля, но должны предоставить пароль для изменения, тогда файл просто заблокирован. В зависимости от формата может быть достаточно просто немного перевернуть с помощью шестнадцатеричного редактора или изменить сам ридер; например, у Evince есть настройка, позволяющая игнорировать ограничения PDF. (Но см. Ниже ↓.)

  • (Существует небольшая вероятность того, что пароль был использован для проверки подлинности / целостности , а также, используя некоторый хэш, хотя я не могу вспомнить любую схему , которая позволила бы проверку , не зная пароль, так что это , вероятно , вряд ли .)

Но не забывайте, что автор мог просто встроить изображение текста вместо самого текста. Может быть, PDF вышел из сканера. Может быть, это не PDF, а документ PostScript .ps , который находится где-то посередине между текстом и изображением.


↓ Этот бит, однако ...

Я полагаю, если он был зашифрован, его нельзя выбирать, а нужно вписать в страницу, как изображение.

... отчасти ерунда, но отчасти интересная идея.

С одной стороны, шифрование не меняет способ работы данных. Если вы зашифруете текстовый документ (например, файл PDF), а затем расшифруете его, вы получите те же самые байты обратно - вы получите оригинальный документ, а не его плоское изображение.

Тем не менее, он мог бы работать таким образом - в документ можно было легко встроить две версии; визуализированное изображение, читаемое кем-либо, и зашифрованный оригинал, читаемый (и, следовательно, изменяемый) только с паролем. Чтобы изменить документ, вам нужно будет расшифровать оригинал, отредактировать его и снова отобразить изображение.

Я знаю, что документы Office этого не делают - пароль для модификации - это просто замок. Я менее уверен насчет PDF.

Но я также сомневаюсь в этом, поскольку у этой схемы двойного документа есть серьезная лазейка: кто-то может по-прежнему напрямую фотошопить изображение, и поскольку оригинал зашифрован, это будет невозможно обнаружить.

1

Я давно вспомнил о чтении спецификаций PDF, что читатели должны соблюдать ограничения по паролям, но спецификации предоставили достаточно информации, чтобы позволить им игнорировать ее.

Пароли PPT похожи на PDF ... в файле есть немного данных, которые сообщают приложению PowerPoint: «Спросите пользователя, прежде чем открыть этот файл». Данные в файле не зашифрованы.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .