9

Мне нужно сохранить документ Word в формате HTML. У этого есть некоторые фоновые изображения, другие изображения, тексты, ... Он правильно открывается в Internet Explorer, но как я могу сохранить слово doc как HTML, чтобы Firefox и другие современные браузеры отображали его правильно?

Все изображения отсутствуют в документе. Я просмотрел сгенерированный HTML-документ, но пути к изображениям выглядят правильными.

Любая идея?

Такие вещи, как «Не сохранять документы как HTML» здесь не помогут.

Редактировать: чтобы прояснить ситуацию, обычное "Сохранить как HTML" не обрезается, результат искажается в любом браузере, кроме Internet Explorer.

Изменить 2: я использую Word 2010 и Firefox 4. Я также попытался отрендерить его в последней версии Chrome, что также не удалось. Я использовал разные настройки совместимости для сохранения как html, это не помогло

7 ответов7

5

При использовании Word Save As Web Page(htm html) перед нажатием кнопки "Сохранить" обратите внимание на выпадающий "Инструменты" слева от кнопки "Сохранить". Зайдите в это раскрывающееся меню, выберите «Веб-параметры». В появившемся окне параметров ОТКЛЮЧИТЕ поле с надписью «Положитесь на VML ...». Это отлично сработало для меня. Удачи.

4

У меня есть взлом, который включает в себя изменение кода HTML напрямую. Я использую MS-Office 2007 и FF 10.0.4.

Хитрость заключается в том, чтобы удалить <v:imagedata src = ...> который генерирует Word при сохранении файла в HTML, и заменить его стандартным <img src = ...> . Первый (imagedata ...) может отображаться только IE, в то время как последний является стандартным и может обрабатываться всеми браузерами.

Пример:

Удалить следующее -

<span style='mso-no-proof:yes'><v:shape id="Picture_x0020_2" o:spid="_x0000_i1026"
 type="#_x0000_t75" style='width:282.75pt;height:207.75pt;visibility:visible;
 mso-wrap-style:square'>
 <v:imagedata src="dcsl_overview_files/image006.png" o:title=""/>
</v:shape> </span>

С:

<img src="dcsl_overview_files/image006.png" alt="overview figure">
2

Я столкнулся с той же проблемой. Кажется, что по некоторым причинам Word действительно экспортирует обычный HTML для некоторых документов.

Обычно Word экспортирует графику с двумя кодами: специальный для рендеринга в IE и обычный HTML для других браузеров.

Код выглядит как показано ниже (я удалил много кода для удобства чтения)

<p ...><span ...><!--[if gte vml 1]><v:shapetype...>
 [code for IE]
</v:shapetype>
<v:shape id="Picture_x0020_2" ... alt="...png" ...>
 <v:imagedata src="...docx_files/image001.png".../>
</v:shape><![endif]-->
<![if !vml]><img width=169 height=119
src="..."... ><![endif]></span></p>

Заметьте условное?

<!--[if gte vml 1]> IE Code <![endif]--> <![if !vml]> Non IE HTML <![endif]>

Для некоторых документов я вижу, что Word перестает быть двуязычным и экспортирует только часть IE.

У меня пока нет решения для этих случаев. Все еще расследую

1

Попробуйте сохранить как веб-страницу, фильтр, чтобы удалить специфичные для Office теги. В Word 2007 это очищает все уродливые офисные теги и генерирует чистый HTML-файл.

1

Я пробовал только простой документ, отображаемый в Chrome, поэтому YMMV - но вы пытались сохранить как Web Page, Filtered (доступно в моей копии Word 2010, и я предполагаю, что во всех версиях).

Это должно убрать массу худших вещей, но, тем не менее, результат не всегда может быть идеальным, не зависящим от браузера HTML.

0

На панели быстрого доступа есть опция предварительного просмотра веб-страницы. Я думаю, что это должно работать (я проверял это, когда у меня был Word 2007, и я не знаю, доступен ли он в 2010 и 2013 годах).

-2

Поскольку, очевидно, больше ничего не получалось, это стало одним из этих чертовых решений "только для IE".

Изменить: Просто чтобы уточнить: я ответил на это сам, так как я не получил никакого другого ответа в течение 8 месяцев. Поскольку в данный момент мне больше не нужно решение, и это было слишком давно, я не приму / не смогу принять другое решение.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .