2

Есть ли инструмент командной строки, который может искать .docx файл под MS DOS или Cygwin?

Я пробовал Grep, он не работает с .docx а работает нормально с файлом .txt .

Я знаю, что всегда могу конвертировать .docx в .txt 1-й, а затем искать с помощью Grep, но мне интересно:

Есть ли командный инструмент, который я могу искать прямо в командной строке?

Редактирование OP: Позже я узнал, что самый простой способ получить grep - это на самом деле преобразовать эти docx в txt, а затем выполнить grep поверх них.

2 ответа2

3

Существует множество библиотек, позволяющих читать или иным образом манипулировать файлами DOCX. Например, Apache POI или python-docx . Я не знаю, есть ли уже обертка, которая позволила бы вам создавать DOCX, но это наверняка не было бы слишком сложно сделать с помощью POI (у меня нет опыта работы с python-docx. Это могло бы все еще быть более быстрым решением.).

РЕДАКТИРОВАТЬ:

Кроме того, проще, вы можете разархивировать DOCX (потому что на самом деле это просто ZIP-файл), и просмотреть содержимое, как предлагается здесь.

0

Я использовал для этой цели antiword/catdoc. Очевидно, была проделана определенная работа по расширению функциональности, чтобы включить и файлы docx. :-)http://blog.kiddaland.net/2009/07/antiword-for-office-2007/

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .