Часто, когда я открываю PDF, я вижу фон страницы, который появляется перед тем, как появляются текстовые элементы или фотографии.

Это сбивает с толку меня, потому что многие из этих PDF-файлов взяты из сканов Google старых библиотечных книг ... а не из многослойных PSD, и именно так они себя ведут. Элементы текста и фото буквально удаляются со скана - фон распределяется по пустому пространству - затем текст и фотографии векторизируются и накладываются обратно на фон? Что на самом деле происходит?

1 ответ1

1

Это может быть связано с тем, что программное обеспечение OCR используется для автоматического преобразования изображения в текст. Это происходит, когда я сканирую страницы учебника с помощью моего сканера Xerox с возможностью распознавания текста. Часто текст из полученного PDF-файла не может быть точным, содержать лишние пробелы или находиться на разных слоях полностью!

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .