Файлы DOC - это (предполагается) устаревший формат. Иногда файлы DOC были в двоичном формате, а иногда файл DOC представлял собой простой текстовый RTF с расширениями Word.
Файлы DOCX представляют собой простой текстовый XML и другие данные (например, изображения), хранящиеся в дереве папок, сжатые и сохраненные в формате zip. Вы можете изменить расширение на ZIP, а затем открыть их. (Удобно для извлечения изображений).
Word 2010 в Windows просто изменит расширение файла на DOC, если вы используете "сохранить как", но это все еще заархивированный файл DOCX.
Если вы сохраните его как RTF, вы, вероятно, сможете воспроизвести поведение в вашей среде Windows.
Я провел тест с одной страницей текста из книги, выбранной случайным образом из проекта Гутенберга:
- RTF = 205 КБ
- DOCX = 25 КБ
- RTF архивируется с использованием стороннего программного обеспечения = 31 КБ
Поэтому я думаю, что разница в размере файла обусловлена сжатием ZIP.
Защищенный вид? возможно, файл поврежден, может быть, у вас есть встроенный макрос VBA, и у них есть 100% блокировка макрополитики, кто знает. Я бы задал этот вопрос отдельно.