Если я скопирую какой-нибудь текст из PDF, текст будет выглядеть корректно, однако текстовый редактор считает, что текст представляет собой одну длинную последовательность.

Как строка появляется в блокноте:

блокнот

Единственный способ визуально увидеть, что есть проблема с текстом, - это скопировать текст в vi через Cmder:

VI

Текст выглядит следующим образом в шестнадцатеричном редакторе:

HxD

Я пытался использовать Puretext для удаления невидимого символа при вставке, но это не работает:

PureText

Попытка скопировать и вставить символ в диалог замены редактора и заменить его пробелом не дает результатов.

Единственный способ, который я нашел, это работает - вручную удалить каждое "пробел" и заменить его реальным пробелом.

Каков рекомендуемый способ легко удалить эти невидимые символы при вставке или использовать поиск и замену?

1 ответ1

0

Вот простое решение:

Программа просмотра PDF, которую я использую, - SumatraPDF. Если я использую Chrome как средство просмотра PDF, он не вводит неразрывный пробел в скопированный текст.

Программа просмотра Chrome PDF вставляет правильное пространство в скопированный текст.

Изменяя средство просмотра PDF, используемое для этих конкретных файлов PDF, проблема решается.

Я проверил это с различными PDF-файлами, и проблема только с этими конкретными PDF-файлами.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .