Мне нужно конвертировать файлы PowerPoint PPTX в HTML с помощью командной строки. HTML-файл должен сохранять текст в виде текста (не изображения) при преобразовании всех фигур, смарт-артов и графиков в изображения (или, если не изображения, то SVG).
Я пытаюсь сделать это с помощью LibreOffice Impress 4.4.3.2.
Если я открою Impress и экспортирую файл PPTX в HTML, все слайды преобразуются в изображения, включая текст. Если я экспортирую в PDF, он действительно сохраняет текст и преобразует все формы, но, увы ... Я хочу, чтобы HTML не PDF.
Используя командную строку (в Windows 8), я попробовал все фильтры HTML, которые я нашел: текст ссылки
Большинство из них просто не работали. Ближайшее, что я мог найти:
soffice.exe --headless --convert-to html --outdir d:\temp d:\temp\presentation.pptx отлично преобразовал текст, но по какой-то причине все фигуры и графики отсутствуют в преобразованном HTML-файле.
Как я могу решить мою проблему? Возможно, некоторые другие бесплатные инструменты / библиотеки .net могут сделать это?