2

Я хочу преобразовать этот PDF-файл, содержащий таблицу, в электронную таблицу, совместимую с Excel, для создания флэш-карт.

Кто-нибудь знает об автоматическом способе сделать это без ручного копирования каждой фразы в правильный столбец?

3 ответа3

2
  1. Формат PDF с момента его создания (более 20 лет назад) никогда не предназначался для размещения извлекаемых, осмысленно структурированных данных.

  2. Его первоначальная цель состояла в том, чтобы быть надежным визуальным представлением текста, изображений и диаграмм в документе - своего рода цифровой бумаге (которая также будет надежно перенесена на реальную бумагу посредством печати). Только позже в его разработке были добавлены дополнительные функции, среди которых некоторые, которые должны помочь в извлечении данных снова (Google для Tagged PDF).

  3. Некоторые примеры проблем, возникающих при извлечении таблиц из PDF-файлов, см. В этой статье:

  4. Противоречие с моей точкой «1». выше, теперь я говорю это: для удивительного семейства инструментов, которые становятся все лучше и лучше от недели к неделе для извлечения табличных данных из PDF-файлов (если они не отсканированные страницы), смотрите эти ссылки:

Итак: иди ищи Табулу. Если какой-либо инструмент может делать то, что вы хотите, в настоящее время (через 4 года после того, как был задан этот вопрос), Tabula, вероятно, среди лучших для этой работы!


PS: Tabula - это свободное и открытое программное обеспечение, написанное на Ruby.

1

Я знаю, что это старый пост, но есть много бесплатных инструментов, которые вы можете использовать для разовых конверсий. Вот некоторые примеры:

Вы найдете гораздо больше, если вы будете искать PDF Table to Excel в Google.

1

Конвертируйте PDF файлы в документы Microsoft Excel, извлекайте таблицы. Этот бесплатный конвертер PDF и PDF создатель быстр и надежен. Надеюсь, это было полезно

http://www.freepdfconvert.com/pdf-excel

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .