1

Мне нужно конвертировать некоторые очень большие файлы HTML (около 800 КБ, PDF эквивалент около 30 страниц) в MS Word. Это легко до определенного момента: просто откройте в Word и сохраните как DOCX. Проблема в том, что результирующий документ Word занимает более 3 МБ, и для его открытия требуется десять минут. Это почти непригодно.

Одной из проблем может быть - HTML имеет огромное количество элементов формы, и преобразованный документ Word пытается сохранить их работоспособность (например, наборы переключателей продолжают функционировать, как в веб-браузере). Это не обязательно. Было бы хорошо, если бы они были преобразованы просто в статичные вещи. Смысл слова docs в том, чтобы предоставить рецензентам удобный формат для рецензирования и комментирования текстовой части.

Кто-нибудь знает - - способ глобально отключить все элементы формы в слове документа, или преобразовать их в некоторые статические эквивалентные изображения или что-то еще? - утилита, которая преобразует HTML в Word и пропускает функции, вызывающие раздувание документа? - другие хитрости, чтобы уменьшить мега-раздувание в больших HTML-файлах, открытых в Word?

0