1

У меня ~ 160 файлов MS Word, которые содержат структурированные данные. Данные форматируются одинаково для всех файлов и хранятся в табличном формате.

Я хотел бы извлечь данные в базу данных, XML или просто сводную таблицу, не открывая каждый файл независимо.

Есть ли инструмент или метод, который я могу использовать для извлечения этих данных?

1 ответ1

1

Ну, вы могли бы написать код, используя python (или любой другой язык, но я предпочитаю python:D), чтобы извлечь данные из файлов и поместить их в базу данных. Вы можете использовать модуль Python UNO для использования API открытого офиса и извлечения данных. Пример кода на python, который может помочь вам http://wiki.services.openoffice.org/wiki/PyUNO_samples. Весь код должен быть легко написанным, если данные хорошо структурированы.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .