Насколько близко 1: 1 использование хранилища SVN-сервера по сравнению с уменьшенным размером контента?

297
Enigma

Скажем, я загрузил 100 ГБ контента с сервера VisualSVN. Могу ли я сделать какие-либо выводы о пространстве, которое используется на самом сервере для хранения этого контента?

Если это все сжато, я бы предположил, что это занимает чуть менее 100 ГБ.

Если есть огромное количество журналов или еще много чего, теоретически это увеличит размер.

В любом случае, я могу надежно определить объем используемой памяти сервера?

1

1 ответ на вопрос

2
Mokubai

Достоверно? Нет шансов.

Svn использует аналогичные методы, чтобы diffуменьшить размер отдельных коммитов, файлы эффективно сжимаются в «базовый» файл и дополнения и вычитания из этого файла. Это, видимо, даже работает для двоичных файлов

Проблема, однако, в том, что вы не вытаскиваете все эти промежуточные BLOB-объекты, в течение нескольких ревизий объем пространства, используемого для определения разницы между ревизиями, может быть в несколько раз больше, чем сам файл.

Вы также не опускаете удаленные файлы. Если вы работаете с особенно большими файлами, которые регулярно удаляются, этот удаленный файл будет храниться на сервере до конца времени, но никогда не будет отображаться на вашем жестком диске. Это заставит сервер иметь большее количество данных по сравнению с вашей копией.

Если вы часто используете внешние элементы для связывания больших проектов, вы можете получить в несколько раз больше данных, чем если бы вы проверяли только отдельные проекты. Теги также почти не занимают место на сервере (если вы не редактируете файлы под ними), поэтому их проверка также не соответствует занимаемому на сервере месту.

Единственный вывод, который вы действительно можете сделать, заключается в том, что при заданных дельтах файлов, журналах и удаленных файлах и до тех пор, пока вы исключаете внешние данные и теги / ветви, сервер, вероятно, имеет больше данных, чем ваша локальная копия. Сжатие файла может повлиять на это, хотя.

Какой диапазон несоответствия можно увидеть? Может ли хранилище на сервере использовать в два раза больше извлеченного размера? Enigma 8 лет назад 0
Трудно сказать с какой-либо реальной властью. Если ваша проверка содержит много тегов или внешних элементов, то сервер может использовать крошечную часть размера вашей проверки. Если ваша выписка не содержит тегов и внешних элементов, а хранилище относительно молодое, то, возможно, размеры будут одинаковыми или, по крайней мере, в пределах того же порядка. Можно было бы использовать в два раза больше, но при таком размере я был бы удивлен, и вам пришлось бы использовать много несжимаемых данных. Mokubai 8 лет назад 2

Похожие вопросы