Я сгенерировал несколько отчетов в формате PDF с использованием кода Sweave в R. Эти отчеты требуют небольшого редактирования. Для этого я преобразовал эти отчеты в файлы Word с помощью Adobe Acrobat Reader. Но после преобразования некоторая часть текста вверху включается в заголовочный раздел. Это создает некоторые проблемы. Итак, мой вопрос, есть ли способ в Word, с помощью которого я могу удалить заголовки со всех страниц при объединении содержимого заголовка с телом или не создавать заголовки при преобразовании pdf в файл Word?
1 ответ
Некоторые программы чтения PDF-файлов позволяют подавлять повторяющиеся заголовки на каждой странице при конвертации в документ. У PDF nitro reader была такая возможность в более ранних версиях, но эта функция теперь стала платной в последней версии. или проверьте, предоставляет ли эта возможность какой-либо онлайн-конвертер PDF в слово.
Вы также можете использовать ocr, некоторые ocr-s также дают возможность повторять заголовки, такие как Tessaract, который является бесплатным. или найдите, если какой-либо сайт ocr онлайн дает такую возможность.
Они не будут объединять заголовки с основным текстом, они скорее поместят верхний / нижний колонтитул только один раз. Если вы хотите объединить верхний и нижний колонтитулы с текстом, это так же хорошо, как выбрать инструмент извлечения текста, скопировать весь текст из PDF и поместить его в текстовый документ.