Существует определенный способ ограничения возможности копирования текста из PDF, который работает путем сопоставления каждого символа используемых шрифтов со случайными символами так называемой закрытой области спецификации Unicode. Если читатель такого защищенного PDF-файла попытается скопировать часть текста, все, что он или она получит, это строка глифов, подобная этой:
!
Мой вопрос: есть ли способ исправить эту карту, используя, возможно, алгоритм OCR, чтобы выяснить, на что должен отображаться каждый символ? Возможно, дело может быть более сложным, если сопоставление не является инъективным, т.е. если оно дополнительно искажено таким образом, что один и тот же символ отображается в разных местах символьного пространства Unicode.