pdftotext каким-то образом преобразует все пробелы ("") в знаки процента ("%") и все тире ("-") в шестерки ("6") для конкретного файла PDF.
Есть идеи, как предотвратить такое поведение? Или как это диагностировать?
К сожалению, я не могу поделиться PDF в данный момент. Это может затруднить ответ на вопрос. Но, возможно, кто-то может сделать хорошее предположение в любом случае, основываясь на этих странных заменах персонажей.
pdftotext версия 0.26.5