Мне кажется, что оригинальный документ просто делает то, что я слышал, называется заменой шрифта.
Вот Сербия, в 80-х и 90-х годах быстрый способ получить наши уникальные символы состоял в том, чтобы просто использовать шрифт, который имел наши символы для кодов латинских букв, которые находились на клавиатуре, где была бы наша собственная буква. Например, давайте возьмем слово ужички
. В таких системах вы вводите его как u\i;ki
и используете шрифт, в котором вместо ж отображается значок \, а вместо;; Это очень легко реализовать, потому что вы на самом деле не используете другой набор символов и при правильном отображении здесь не будет никакой разницы. К сожалению, это не очень хорошо работает с интернационализацией и является проблемой, если вам нужно несколько разных наборов символов на одном компьютере.
Насколько я знаю, единственное решение проблем, которые возникли из этого, состоит в том, чтобы использовать программу, которая преобразует такой текст в надлежащий текст Unicode. Проблема здесь в том, что у вас есть смесь греческих и латинских символов, поэтому программа не может просто тупо заменить. Насколько я понимаю, нет простого способа решить проблему.
Вы можете попытаться получить документ и запустить его через соответствующую программу OCR, которая будет распознавать буквы и выводить в Unicode, но я довольно давно не использовал OCR, поэтому не могу рекомендовать такую, которая поможет. Также обратите внимание, что некоторые программы OCR будут принимать входные данные только от сканера, поэтому вы должны быть осторожны при выборе программы OCR, если только вы не хотите распечатать весь документ и не отсканировать его.