Некоторые PDF-файлы сканируются с ужасным качеством, но, похоже, накладываются на это поверх реального текста. Я не совсем уверен, как это происходит, но я полагаю, что пример стоит тысячи слов. Смотрите этот PDF:
http://www.cs.utexas.edu/~shmat/courses/cs380s/prudent.pdf
Обратите внимание на ужасное качество. Однако, если вы выделите текст (протестированный в «Средстве просмотра документов 2.30.3», что, как мне кажется), перетаскивая на него мышь или просто нажав Ctrl-A, внезапно текст станет чистым. Как убрать ужасный качественный оверлей и просто посмотреть текст?
Редактировать: скриншоты
против