Мы с коллегой находимся в разногласиях по поводу деталей сделки. В качестве подтверждения своих требований я попросил его выслать мне копию счета-фактуры, которую он получил вместе с заказом. Коллега говорит, что он использовал сканер, который был частью большого многофункционального копира, когда он сканировал счет в PDF-документ.
Получив документ в формате PDF, я подумал, что некоторые вещи о сканировании выглядят необычно. В попытке взглянуть поближе я решил открыть документ в своей копии Adobe Photoshop CS5. Сразу после открытия я заметил, что документ имеет несколько слоев. Фоновый слой для красочно окрашенного водяным знаком фона счета, другой слой содержит большую часть статического формата текста, который является общим для всех счетов этой компании. Еще один слой содержит большую часть текста, который изменяется в зависимости от заказа, и еще один слой с подписью менеджера по отгрузке со склада.
Я знаю, что некоторые сканеры могут использовать OCR (оптическое распознавание символов) для встраивания дополнительной информации в PDF, чтобы ее можно было искать и редактировать, но я никогда не видел информацию, полученную в результате сканирования, на несколько слоев в документе, подобном этому. Мой вопрос: каким образом любой сканер может разделить содержимое отсканированного физического документа на несколько слоев в файле PDF?