1

Использование Adobe Reader 9 Я просматриваю документ PDF со страницами и страницами текста.

Я думаю, что это отсканированная графика, а не настоящий текст. Я не особенно знаком с форматом PDF, но я предполагаю, что он различает настоящий текстовый и графический контент (что-то вроде HTML или MSWord).

Acrobat имеет различные инструменты / режимы. Если я выберу инструмент «Выделение» и перетащу мышку по тексту, а он просто создаст прямоугольник (а не блок, выделяющий слова), тогда это будет графическое право?

Как вы уже догадались, я надеюсь, что ошибаюсь, но я просто хочу быть уверен.

4 ответа4

1

В Acrobat Reader должен быть инструмент выбора текста , используйте его вместо обычного инструмента выбора. Инструмент выбора текста имеет заглавную букву T рядом с кареткой, как на этих двух веб-страницах.

Я не использовал Acrobat Reader в течение многих лет, поэтому я не могу подтвердить, доступен ли выбранный текст в версии 9. Если это не так, попробуйте использовать обычный инструмент выбора, а затем скопируйте. Если вы можете вставить его в Блокнот или диалоговое окно «Выполнить», то это текст, если вы можете вставить его в MSPaint, это рисунок.

В качестве альтернативы, вы также можете использовать другую программу для PDF-файлов. Foxit пользуется популярностью и имеет бесплатное приложение для чтения, как и Acrobat, но я лично использую Google Chrome сейчас, потому что у него есть плагин PDF, который отлично подходит для практически любых общих целей чтения PDF, включая выбор и копирование текста (Chrome великолепен как PDF читатель, даже если вы не хотите использовать его в качестве браузера!)

0

Да. Использование инструмента выбора - самый простой способ определить это. Однако иногда Adobe Reader использует OCR для копирования текста с изображений в виде текста, а не изображения.

0

Я ничего не знаю о Adobe Reader, но знакомые мне инструменты PDF (Okular и Evince) имеют возможность показывать шрифты для документа. Документ, на котором нет шрифтов, вероятно, сканируется, тогда как документ, который ссылается хотя бы на один шрифт, может иметь настоящий текст. Это ни в коем случае не дурак, но может быть лучше, чем ничего?

Если Adobe Rearder не перечисляет шрифты, то могут ли помочь утилиты, которые поставляются с Poppler (библиотеками Okular и Evince)?

0

Используйте Ctrl-F, чтобы найти текст (например, "a", "e" и "i"; если ни один из них не найден, почти наверняка документ не содержит текста). Если это работает, это текст или OCR'd.

С Ca Cc я ничего не получил в блокноте (Cv). Это еще один способ проверить, что у него нет текста, я думаю.

«Файл> Свойства> Шрифты» (или щелкните правой кнопкой мыши> Свойства> Шрифты) не в порядке: я протестировал графический файл, и у него было 3 шрифта. Также я не заметил никаких других свойств, отличных от текстового pdf.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .