Я хочу создать документы с некоторыми выдержками из файла PDF, который имеет много символов. Когда я копирую и вставляю в MS Word, символы копируются неправильно. Какой лучший способ пойти?
5 ответов
Все зависит от того, как пользователь создал файл и затем поместил его в PDF.
Некоторые элементы основаны на изображениях, в то время как другие будут основаны на тексте и Unicode. Если у вас нет точного шрифта или шрифта, который использовал пользователь (при условии, что вы можете выделить текст, как вы говорите), вы не сможете правильно захватить символы.
Также, как и в случае с "bubu", с помощью скриншота или программы с технологией захвата экрана (Microsoft OneNote или встроенный Screen Clipper в Win7) вы сможете получать символы с помощью изображений.
Как отмечали люди, это во многом зависит от встроенных шрифтов, шрифтов в вашей системе и т.д.
Однако, иногда исправляя это просто выбор подходящего альтернативного шрифта для правильного отображения символов:
Выберите один из неправильных символов в Word. Как называется шрифт в поле "Шрифт"? (например, "Стандартные символы L")
Прокрутите вниз шрифты в поле шрифта и посмотрите, есть ли это имя в списке. (например, в Windows "Стандартные символы L" не будут в вашем списке шрифтов)
Если его нет в списке, это означает, что у вас нет этого шрифта на вашем компьютере. Попробуйте сменить шрифт того же типа, который есть на вашем компьютере. (например, измените "Стандартные символы L" на "Символ")
Вы можете использовать поиск и замену Word, чтобы найти все вхождения одного шрифта и заменить его другим.
Если эти символы являются математическими, вы можете вместо этого использовать их в изображении или печатать их, если вам нужно, чтобы они были выбираемыми символами при публикации. Если эти символы Unicode, вы должны изменить свой шрифт на шрифт, который поддерживает используемые символы ...
Мое предложение будет открыть его, увеличить масштаб и сделать скриншот. Это, безусловно, самый простой ... Обычно символы в файлах PDF являются либо встроенным шрифтом, либо даже графикой.
К сожалению, ответ, это зависит!
Первое, от чего он зависит, конечно же, сам PDF, какие шрифты / наборы символов / кодировки мы использовали для его создания.
Второе - это ваше программное обеспечение для просмотра PDF и как оно обрабатывает выделение и копирование текста. Хорошо ли сохранен сам макет при копировании / вставке?
Если кодировка символов для символов странная, но непротиворечивая, лучшим вариантом может быть поиск и замена в слове после выполнения импорта.