5

Как я могу скопировать или экспортировать таблицу из документа PDF в Word, Excel, OneNote и т.д. В виде таблицы вместо обычного текста?

Пример pdf: ftp://ftp2.cits.rncan.gc.ca/pub/canvec/doc/CanVec_transition_guide_en.pdf, начиная со страницы 9. Я использую Office 2003, пробную версию OneNote 2007.

8 ответов8

5

Вы можете использовать программу просмотра документов Okular, доступную в Linux и Windows через установщик http://windows.kde.org/ .

Он может выбрать текст в виде таблицы, где вы можете определить строки и столбцы.

4

MirzaD, спасибо, что предложили Okular. Я установил его на свой рабочий стол Ubuntu, и никогда не воспринимал это всерьез ... до сих пор. Благодаря вам.

Okular is awesome по своим возможностям и может удовлетворить потребности парня, задающего вопрос. В Okular вы используете Table Selection Tool и определяете область, а затем щелкаете по границам столбцов, чтобы пометить поля ..., а затем копировать. Когда вы вставляете его, вы получаете согласованный вывод с разделителями табуляцией, который любой серьезный инструмент можно уговорить обработать как файл CSV.

У меня есть эта потребность (для извлечения нескольких таблиц из документа PDF) сейчас на рабочем столе Centos с gnome/xfce, и установка okular будет означать установку целого ряда других графических инструментов KDE. Итак, я сначала попробую с tabula (который тоже выглядит очень многообещающе), и если это не удастся, то это будет нормально.

Будет ли это работать для Windows? Да, KDE может быть установлен в Windows, но приложения KDE идут с некоторыми дополнительными затратами на другие ненужные программы. Таким образом, это зависит от того, насколько велики ваши потребности, это может быть жизнеспособным вариантом даже для окон.

Узнайте больше о Okular здесь .. и их лозунг More Than a Reader безусловно, подходит .. Я действительно впечатлен тем, что Okular может сделать в аккуратном и достаточно быстром приложении с небольшим размером.

Проект KDE для Windows .. позволяет легко установить множество отличных приложений KDE в Windows.

4

Вы можете попробовать Tabula - работает очень хорошо для ориентированного на данные контента, размещенного в таблицах.

Краткое вступление можно найти на главной странице.

Используя инструмент для PDF, прикрепленный к этому вопросу, вы должны:

  1. Загрузите файл на свой локальный диск.
  2. Установите и запустите инструмент, следуя инструкциям на домашней странице.
  3. Загрузите PDF и выберите Отправить.
  4. Перейдите к первой таблице и выберите таблицу. Убедитесь, что вы не выбрали верхний и нижний колонтитулы страницы, чтобы получить более точный результат. Табула - выбор таблицы
  5. Выберите Повторить этот выбор, если вы хотите выбрать следующие таблицы, используя те же координаты.
  6. Выберите Скачать все данные, и вы получите. Табула - извлеченные табличные данные
  7. Выберите Загрузить данные, чтобы получить файл CSV с извлеченными таблицами. Этот файл можно открыть в MS Excel или любом другом приложении, которое может считывать формат CSV для дальнейшей обработки.
2

Откройте документ с помощью Adobe Acrobat. Нажмите Файл> Сохранить как. Выберите «HTML 4.01 с CSS 1.0 (* .htm, * .html)» в "Сохранить как тип", затем сохраните.

Затем вы можете открыть сохраненный HTML-файл в Microsoft Word, и он будет отображаться в виде таблицы вместо простого текста.

2

www.freepdftoword.org - бесплатный онлайн сервис. Надежно работает над созданием настоящих таблиц объектов в Word.

1

Связанные вопросы и ответы были, очевидно, удалены:https://stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatics/857800 (см. Кэшированную версию:http://webcache.googleusercontent.com/ поиск?q = кеш:9I328EN_d64J:stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatics/857800+&cd=1&hl=en&ct=clnk&gl=ch).

Ниже мой ответ, подтверждающий, что Okular - отличный выбор для быстрой сдачи в аренду.

Для быстрого (сингл?)Извлечение таблиц стоит попробовать превосходный инструмент выбора таблиц Okular.

  1. Откройте файл PDF и найдите нужную таблицу.
  2. активировать инструмент выбора таблицы с помощью Ctrl+5
  3. нарисуйте прямоугольную область, чтобы ограничить стол
  4. наконец, и, если необходимо, определите вертикальное и горизонтальное деление ячеек таблицы, щелкнув по краям (вам может потребоваться немного поиграть, чтобы понять идею - см. скриншот ниже).

Выбор с помощью инструмента выбора таблиц Okular

Вуаля! Скопируйте и вставьте, например, в пустую электронную таблицу.

1

Это сложный вопрос. Если у вас есть средства, самое простое решение будет связаться с человеком, который сделал PDF. Скорее всего, они сделали это из файла .doc. Если вы можете получить оригинал, у вас есть то, что вам нужно, без необходимости конвертации.

0

Я не люблю добавлять дополнительное программное обеспечение или отправлять свои данные за границу на внешний сайт для их преобразования. Обычно из-за временного аспекта!

Но в PDF-файлах вы можете выбирать данные в столбцах, удерживая нажатой клавишу «Alt» и перетаскивая их, если ваша таблица невелика (то есть вам придется делать это для каждого столбца). Просто скопируйте и вставьте каждый в слово.

Не идеально, но работает без необходимости устанавливать что-либо дополнительно!

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .