Какое место наиболее эффективно для репозиториев git: файлы LibreOffice/OpenOffice .odt
или файлы .fodt
? Я думаю, что это должен быть .fodt
, поскольку в несжатом формате XML .fodt
компрессор хранилища сможет эффективно использовать избыточность между файлами, тогда как файлы .odt
уже сжаты и не могут быть сжаты в дальнейшем. Но это только предположение. У кого-нибудь есть практический опыт?
2 ответа
Я выполнил следующий тест:
Поместите 5 ревизии небольшого .odt в хранилище. Я сделал небольшие изменения в каждом документе.
Я фиксирую аналогичные данные для.FODT. Они получены путем извлечения соответствующей версии ODT и сохранения ее в.FODT.
Мои результаты следуют:
before gc after gc
odt 260k 260k
fodt 118k 38k
Обратите внимание, я измерил размер директории .git, где ревизия действительно сохранена.
Я не учел сам ODT/FODT-файл, потому что это не дает разумных результатов.
Я измерил только размер папки .git.
ODT очень похож на сжатый FODT, и ожидается, что FODT намного больше, чем ODT.
Поскольку может иметь смысл оценивать рост истории Git, то при измерении размера Git следует исключать ODT/FODT, поскольку они хранятся непосредственно один раз, независимо от длины истории. В долгосрочной перспективе история занимает большую часть пространства, поэтому для получения более релевантных измерений при простом тестировании сами документы в рабочем каталоге НЕ должны учитываться при оценке размера репо.
Выполняя небольшое и быстрое тестирование, я поместил десять ревизий крошечного файла .odt
в пустой репозиторий git, а затем поместил те же десять ревизий документа в формате .fodt
в другой репозиторий. Полученные размеры хранилища:
before gc after gc
odt 408k 188k
fodt 399k 148k
Таким образом, .fodt
предлагает очень небольшую экономию в размере хранилища, хотя сам файл .fodt
в 2,7 раза больше, чем эквивалентный файл .odt
.