1

Много раз, когда я делаю свое обычное резервное копирование документа (перезаписывая предыдущий), я обнаруживаю, что, хотя я добавил достаточное количество текста в новый документ (и НЕ изменил форматирование существующего текста), он может быть меньше, чем старый документ.

Иногда после добавления примерно 3 тысяч слов в данный документ его размер может уменьшиться на 15 КБ по сравнению с предыдущей итерацией того же документа (без уменьшения размера существующих изображений или редактирования форматирования).

Какова причина этого?

2 ответа2

3

Современный формат текстовых файлов - это набор xml-файлов внутри zip-контейнера (продолжайте, переименуйте ваш файл .docx в .zip и вы сможете открыть файл в вашей любимой zip-программе).

Если текст, который вы добавляете в файл, хорошо сжимается, например, он содержит много повторяющихся текстовых шаблонов или в исходном документе использовалась более старая версия стандарта, которая не использовалась в качестве агрессивной настройки zip, размер файла может закончиться вверх из-за того, как файл был заархивирован после слова.

-2

Никто действительно не понимает формат файла для слова, даже Microsoft, даже те, которые перевернули его. Есть стандарт для этого, но это, как говорят, бесполезно.

Известно одно: современные версии представляют собой набор файлов, заархивированных. Поэтому алгоритм zip в следующий раз может работать лучше.

Другой вариант, это может сделать какую-то сборку мусора: удалить вещи, которые больше не нужны. (Хорошо известно, что люди извлекали удаленный текст из текстовых документов, часто смущая автора.)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .