2

У меня есть документ Word с большим количеством встроенных изображений. Чтобы упростить контроль версий, я хотел бы сохранить документ в формате XML и сохранить все изображения отдельно (по ссылке).

В формате docx изображения хранятся отдельно внутри zip, но я пока не нашел способа использовать эти файлы без сжатия.

2 ответа2

1

Я извлек файлы из .docx (переименовав его в .zip). Затем я сохранил свой документ как Word XML и в текстовом редакторе удалил элементы <pkg:package> содержащие двоичные данные изображений, и добавил тег TargetMode="External" к элементам <Relationship> . Добавить TargetMode было довольно легко, используя поиск и замену, потому что все изображения назывались media/image...

После этого я обнаружил, что файлы .gif были сохранены как .png в docx, поэтому мне пришлось изменить расширения этих файлов в xml.

Для Word 2013 вам также нужно изменить теги <a:embed ... на <a:link ... чтобы он работал (с относительными путями).

0

Вы можете переименовать файл DOCX в .zip и открыть его с помощью любой стандартной программы, например Winzip. Затем вы можете извлечь все изображения из документа \ носителя на жесткий диск. Оттуда вам нужно будет решить, как автоматизировать (скорее всего, с помощью макроса) замену встроенных изображений на связанные на жестком диске.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .