11

Иногда документы Word кажутся более или менее разрушенными, обычно, когда макет стал довольно сложным, и документ несколько раз переходил из рук в руки и / или версии. Симптомы могут заключаться в том, что ничего не происходит при нажатии клавиш возврата или клавиши Enter в определенном месте документа, где он действительно должен работать, или что форматирование, кажется, применяется и сбрасывается более или менее случайным образом. Я думаю, что мы все были там.

Зачастую бывает очень сложно точно понять, что не так, поскольку то, что происходит в Word, скрыто от глаз. Вы можете иметь документ, который выглядит пустым, но на самом деле базовое состояние относительно форматирования и т.д. Может быть довольно сложным.

В этих случаях было бы полезно взглянуть на исходный код за тем, что показано на странице; как то, как вы в браузере могли бы делать View Source, и в идеале иметь возможность вносить изменения непосредственно в исходный код, например, как это было бы при использовании Latex. Существует ли команда или утилита View Source-type для документов Microsoft Word?

Я думаю, что нет такой команды, или я бы услышал об этом. Если это так, есть ли у кого-нибудь хороший подход, когда дело доходит до контроля над раздражающим "скрытым форматированием" в документе Word?

Я подозреваю, что могут быть некоторые различия в форматах .doc и .docx; Я заинтересован в обоих случаях.

С наилучшими пожеланиями, Филипп

2 ответа2

10

Если форматирование - это то, что вас в первую очередь интересует, тогда в Word есть хорошая возможность проверить все типы форматирования, примененные к тексту и объектам, которые называются « Показать форматирование». В Word 2007 и 2010 ярлык для этой панели - Shift + F1.

В противном случае, если вы ищете более глубокое понимание формата документа, вы можете посмотреть на XML для файлов DOCX.

  1. Найдите свой документ DOCX на диске.
  2. Измените расширение документа с .docx на .zip.
  3. Дважды щелкните файл и откройте его в менеджере архивов по умолчанию.
  4. Перейдите в папку "Word" в программе zip и откройте Document.xml. Это код, который составляет основную часть содержимого документа, хотя другие файлы также используются другими способами, например, для стилей или информации о шрифтах.

Вам определенно понадобится приличный редактор XML только для просмотра данных, и даже тогда он довольно сложный и для большого документа будет очень и очень длинным.

Когда дело доходит до DOC, нет простого способа "просмотреть исходный код", поскольку это двоичный файл, состоящий из отдельных потоков, и, следовательно, нет простого способа просмотра содержимого.

3

Я думаю, что формат .doc довольно сложный, поэтому я не могу вам здесь помочь. Однако на самом деле .docx - это zip-файл, в котором все данные хранятся в XML-файлах. Таким образом, переименуйте файл в .zip и посмотрите на источник!

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .