Мне нужно было собрать данные из PDF в электронную таблицу Excel для дальнейшего анализа. Каждая страница PDF начинается с "Неклассифицированной" вверху и строки с заголовками столбцов. Я использовал NitroPDF для преобразования PDF в Excel (pdftoexcelonline.com/en/).

PDF данных

Казалось, что это прекрасно работает, и я приступил к конвертации тысяч записей. Однако после просмотра я заметил, что каждая новая страница PDF, похоже, создала новый столбец в моем листе Excel. Столбцы Excel

Вопросы: у меня тысячи записей.

  1. Есть ли способ удалить эти лишние столбцы, сохранив целостность данных и форматирование?

ИЛИ ЖЕ... 2. Лучше ли решить эту задачу во время первоначального преобразования из файла PDF в файл Excel, и, если да, может кто-нибудь порекомендовать, как это сделать?

Спасибо.

0