Мне нужно преобразовать документ Word в легко разбираемый формат, поэтому я выбрал XML. Я нашел инструмент, который работает, но он не говорит мне, какой шрифт текста, который является моим основным методом анализа. Есть ли инструмент, который сохраняет эту информацию или ссылку на учебник, который предоставляет код?

2 ответа2

0

Вам нужен сопроводительный документ XSL, это должно помочь: http://webdesign.about.com/cs/xslinformation/a/aa051198.htm

0

Word 2012 (и Word 2007 через надстройку) может хранить документы Word в WordML (.docx) в формате xml.

Этот формат легко разбирается - есть библиотеки для нескольких языков, а некоторые, например .NET, имеют встроенные возможности разбора.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .