.odt vs .fodt: какое пространство наиболее эффективно для репозиториев git?

1814
Matthew Cline

Какое место наиболее эффективно для хранилищ git: .odtфайлы или .fodtфайлы LibreOffice / OpenOffice ? Я думаю, что так и должно быть .fodt, поскольку в несжатом формате XML .fodtкомпрессор хранилища сможет эффективно использовать избыточность между файлами, тогда как .odtфайлы уже сжаты и не могут быть сжаты в дальнейшем. Но это только предположение. У кого-нибудь есть практический опыт?

3

2 ответа на вопрос

3
sergtk

I performed following test:

Put 5 revision of small .odt to repository. I made small changes in every odt-document.

I commit similar data for .FODT. They are obtained by extracting corresponding revision of ODT and saving it to .FODT.

My results follow:

 before gc after gc odt 260k 260k fodt 118k 38k 

Note, I measured size of .git directory where revision actually saved.

I did not accounted ODT/FODT-file itself because this does not give reasonable results.

I measured size of .git folder only.

ODT is very similar to zipped FODT and it is expected that FODT is much larger than ODT.

Since it may sense to estimate grows of Git history then ODT/FODT should be excluded when measuring size of Git, because they are stored directly one time only independently of history length. In long run history consumes most space, so to obtain more relevant measurements on simple test the documents itself in working directory should be NOT be accounted when estimating the size of repo.

1
Matthew Cline

Проведя быстрое и грязное тестирование, я поместил десять ревизий крошечного .odtфайла в пустой репозиторий git, а затем поместил те же десять ревизий документа в .fodtформате в другой пустой репозиторий. Полученные размеры хранилища:

 before gc after gc  odt 408k 188k  fodt 399k 148k  

Так что .fodtпредлагает очень небольшое сохранение размера репозитория, даже если сам .fodtфайл в 2,7 раза больше, чем эквивалентный .odtфайл.

Похожие вопросы