Какой самый безопасный и наименее дорогой способ хранения 10 терабайт данных?

2979
Josh T

Я являюсь членом производственной компании, и мы готовимся к нашему первому художественному фильму. Мы обсуждали методы хранения данных, чтобы сохранить весь наш оригинальный контент в безопасности (как можно дольше). Хотя мы понимаем, что данные никогда не бывают безопасными на 100%, мы бы хотели найти для нас самое безопасное решение.

Мы рассмотрели:

  • NAS объемом 16 ТБ для хранения на месте

  • Жесткие диски емкостью 4-5 2 ТБ (дешевые, но не избыточные), скопируйте исходные материалы на диски и запечатайте их в свободную статическую сумку

  • Запись данных на диски Blu-Ray (отнимает много времени и средств: 200 дисков = $ 5000)

  • Ленточный накопитель (и)?

Я знаю меньше всего о ленточных накопителях, за исключением того факта, что они более надежны, чем диски. Любой опыт / знания с таким количеством данных очень ценятся.

19
Не забудьте сказать им, чтобы они не пытались повесить их на сверхсильные магниты. Плохо для гибких дисков, действительно плохо для жестких дисков ... Hello71 13 лет назад 1
Это не ответ, но, возможно, он вам интересен: http://blog.backblaze.com/2009/09/01/petabytes-on-a-budget-how-to-build-cheap-cloud-storage/ Bobby 13 лет назад 2
How about using DiamonDisc DVD's http://www.tomsguide.com/us/DiamonDisk-DVD-Storage-Cranberry-Thousand,news-5112.html I know, a bit pricey. Moab 13 лет назад 0

12 ответов на вопрос

14
ligos

Это предполагает, что вы собираетесь использовать архив, а не обычное резервное копирование или оперативные данные.

Пойдите для набора жестких дисков SATA (1 или 2 ТБ), плюс несколько дополнений. Скопируйте ваши данные на диски. Используйте QuickPar (или архиватор, который поддерживает тома четности) для создания дополнительных файлов четности. Распределите файлы четности среди ваших жестких дисков.

Информация о четности позволит вам восстановить файлы, если у вас осталось достаточно файлов четности. Таким образом, если один диск умирает, но другие диски с информацией о четности по-прежнему работают, вы можете использовать файлы четности для восстановления оригинала.

Для большей избыточности сделайте все это дважды и храните в разных местах.

Если вы действительно параноик, храните контроллер PCI и PCI Express для SATA на каждом сайте!

Редактировать: Черт возьми, если паранойя - это то, о чем идет речь, иди на всю свинью и храни ПК с гигабитным Ethernet на каждом сайте, способном читать диски!

+1 Я думаю, что вы эффективно определили и придумали новый синдром: «датапараноидизм». ;П jrista 13 лет назад 10
Спасибо за покупку двойных жестких дисков и двойное копирование всех данных, спасибо! Josh T 13 лет назад 0
Что касается «действительно параноидального» аспекта, я думаю, что [адаптер usb sata] (http://www.google.ca/search?hl=&q=usb+sata+adapter), вероятно, будет пригоден для использования через несколько лет, чем разъем, специфичный для материнской платы (например, PCI, PCI-E), хотя и медленнее. matt wilkie 13 лет назад 0
9
SysAdmin1138

Диски LTO4, которые мы используем, могут вмещать 800 ГБ на ленту. Недостатком является стоимость самих дисков. Если вы отказались от 5 000 долларов за диски Blu-Ray, вам не понравится стоимость LTO4. С другой стороны, сами каретки довольно дешевы в расчете на ГБ, поэтому вы можете хранить много копий. Эти ленты имеют хороший срок годности, но вам нужно планировать перенести их на новый носитель после замены ленточного накопителя. Из того, как вы описываете, как вы собираетесь использовать это хранилище, я не думаю, что лента подходит. Нет, если только это не решение для резервного копирования, а не решение для архивирования . Разные проблемы.

Возможно, вы захотите подумать о каком-либо поставщике облачных резервных копий для этого, если ваши ежедневные изменения в сети достаточно малы. Конечно, это зависит от того, насколько мощным является ваше интернет-соединение, и восстановление из него может быть столь же болезненным. Эти сервисы довольно новы, поэтому неизвестно, как они решают проблему банкротства ваших данных; что будет с ним, если они обанкротятся?

Локальное дисковое хранилище - определенно способ. Корпус дисков с легко заменяемыми дисками - это, вероятно, ваш лучший выбор, учитывая ваши ограничения по стоимости. Если вы можете жить с этими данными в автономном режиме, а затем пойти на это. Диски дешевы, а дисководы дешевле ленточных накопителей. Меньше движущихся частей.


Я предполагаю, что вам нужно это для архива, а не для активного использования в роли видео. Если это так, это другая проблема хранения.

LTO5 сейчас 1.5TO. Не уверен, сжат или нет, но точно, 1,5! r0ca 13 лет назад 0
Я настоятельно рекомендую идти по этому маршруту. Стоимость немного высока для единовременного использования (5500 долларов США), но если вы планируете использовать ее в течение длительного времени, 90% от этой стоимости приходится на диск; ленты стоят по 100 долларов каждая и, вероятно, со временем будут стоить дешевле. Кроме того, вы можете транспортировать с минимальным риском повреждения и хранить их в сейфе или аналогичном, также с низким риском. Кроме того, это 1.5T без сжатия, 3T сжато в 2: 1. Slartibartfast 13 лет назад 2
Кстати, LTO4 в настоящее время стоит около $ 40 / штуку CAD / USD. LTO5 стоит ~ $ 120 / шт. CAD / USD. (Источник: CDW) Chealion 13 лет назад 1
Да, но сами ленточные накопители работают в середине тысяч. Я вижу один на NewEgg за 3700 $. SysAdmin1138 13 лет назад 0
3
Josh Newman

В своих исследованиях NAS вы рассматривали устройства с автономным управлением DroboPro или DroboElite ?

Подумайте, сколько будет стоить, если вы потеряете часть / весь отснятый материал и бюджет соответственно;)

2
Adrien

От восьми до десяти жестких дисков по 2 ТБ; сделать два комплекта. Хранить, как уже упоминалось, отдельно ...

Я бы держался подальше от ленты, так как она гораздо более чувствительна к условиям хранения, чем диски; Кроме того, через пять лет шансы хорошие, вы все равно сможете подключить диск SATA к чему-либо, но вы не сможете получить доступ к накопителю на магнитной ленте, который может читать ваши ленты.

Оптика была бы лучшей с точки зрения долгосрочной стабильности, но, как вы упоминаете, затраты и логистика делают их несколько непрактичными.

2
nicorellius

Рассматривали ли вы размещенные услуги? Я не уверен, как цена взвешивается, но вы можете рассмотреть вопрос о хостинге, который продает объемное хранилище. Может быть, AWS ?

Просто чтобы привести некоторые цифры, 10 ТБ на [Amazon S3] (http://aws.amazon.com/s3/#pricing) составляет 1500 долларов США в месяц. Есть также опция «стоимость» за 1000 долларов в месяц, которая называется пониженной избыточностью. hyperslug 13 лет назад 2
Ах, приятно знать - спасибо за данные. nicorellius 13 лет назад 0
Но есть и Amazon Glacier, который намного дешевле хранилища S3 (за 10 ТБ $ 70 / месяц). Однако поиск занимает много времени и стоит дорого, если вам нужно это много делать. Chris 8 лет назад 0
2
James Snyder

Я бы порекомендовал иметь какой-нибудь NAS / RAID для живых файлов, с которыми вы часто работаете. Если вы собираетесь использовать диски большой емкости, вы можете использовать RAID-6 или аналогичный, который, как горячий резерв RAID-5 +, позволяет сбить два диска до того, как ваш RAID-массив будет поврежден, но в отличие от конфигурации горячего резервирования Ваш второй дополнительный диск также будет иметь четность, так что рейду не нужно будет восстанавливать четность в случае сбоя. Поскольку диски становятся больше, существует большая вероятность сбоя диска во время восстановления, поэтому хорошо иметь как можно больше живого паритета.

В дополнение к этому, я бы рекомендовал использовать жесткие диски, такие как ленточные накопители. В наши дни можно даже купить футляры для жестких дисков (а также эти ), которые позволяют вам хранить диски для архивирования. Вы можете выгружать файлы на RAID-массив, а затем делать дополнительные архивные копии на дисках для хранения.

Некоторые компании по производству видео, такие как Pixel Corps, используют аналогичные установки.

Кроме того, я очень рекомендую хранить файлы в нескольких местах (не под одной крышей). Кроме того, обязательно следуйте мантре «если она не написана хотя бы в двух местах, вы еще не сохранили ее». Кроме того, RAID сам по себе не считается резервной копией.

2
Jeff Shattock

Я предполагаю, что это в основном для автономного хранилища резервных копий: его легко создавать и восстанавливать, но он не используется в повседневных операциях.

Диски объемом 2 ТБ можно купить за 140 долларов. Итак, за 10 ТБ, 5 дисков, 700 долларов. Приблизительно 400 долларов, чтобы построить полу-маломощный сервер на базе Debian, Ubuntu или другого Linux-продукта. Если у вас есть система с несколькими сетевыми картами, вы можете связатьсетевые интерфейсы вместе (потенциально, я полагаю, вам нужен управляемый коммутатор, поддерживающий транкинг) для увеличения доступной пропускной способности сервера и защиты от сбоев NIC. Затем вы можете открыть хранилище с помощью samba, NFS или другого метода для рабочих станций, которые должны его использовать. Для такого большого объема данных вам, вероятно, понадобится какая-то избыточность, чтобы, когда (не если) один из этих дисков кусал его, вы не обходились без данных. RAID5 не очень хорошая идея, по нескольким причинам, но RAID10 отвечает всем требованиям. Поскольку сервер работает под управлением Linux, вы можете использовать mdadm для управления массивом RAID. Для этого вам нужно удвоить количество физических устройств, чтобы вы могли использовать до 10 дисков. Общая стоимость этого сервера хранения:

Если вы действительно любите свои данные (если это действительно важные производственные данные, вам следует!), Вы можете создать дублирующий сервер и сделать резервную копию резервной копии. Вы можете сделать это с помощью rsync crontab, который может быть ужасно медленным, с помощью решения netcat / tar pipe, которое будет быстрее, или установить raid-устройства в качестве основы устройства drbd . Поскольку хранилище дублируется на обеих машинах автоматически, вы (по сути) гарантируете резервное копирование данных. Вы можете получить даже любитель и настроить тактовую систему отказоустойчивой, чтобы гарантировать доступность тома данных.

rsync! = резервное копирование. Будьте осторожны, поскольку это может так же легко синхронизировать поврежденные файлы. То есть, если вы не используете более сложную систему с символическими ссылками или что-то для автоматического создания исторических архивов (файлы, которые изменяются, остаются в более старой версии; файлы, которые не имеют только символические ссылки). Kevin Brock 13 лет назад 0
2
falter

Сетевое хранилище Buffalo TeraStation III 8 ТБ - £ 1 085,56

ссылка amazon.co.uk

Я получил версию terastation 1 ТБ, которую я обновил до 4 ТБ, она работает безупречно в RAID5 для меня. Вы можете посмотреть на покупку уменьшенной версии и обновить ее самостоятельно, чтобы сэкономить деньги, или купить несколько терастаций и т. Д.

1
jrista

Я не очень разбираюсь в ленточных накопителях и в семантике хранения данных на ленте, поэтому не могу вам помочь. Учитывая непомерную стоимость использования bluray в качестве массового резервного копирования, я бы остановился на NAS или отдельных дисках.

С NAS / Raid следует опасаться, что, несмотря на то, что они могут хранить значительный объем информации в одном виртуальном диске ... вы должны хранить все диски вместе, а RAID, как правило, не очень хорош в долгосрочной перспективе ». Резервное копирование Вы рискуете потерять более одного диска, потерять само устройство NAS (и редко гарантируется, что заменяющее устройство сможет считывать данные с дисков, даже если это «идентичное» устройство).

Учитывая, насколько радикально дешевые жесткие диски в наши дни и их общую стабильность, я бы выбрал отдельные диски. Вы можете легко получить 10 жестких дисков по 2 ТБ за небольшую плату (возможно, от 1200 до 1500 долларов США) и создать два набора резервных копий. Вы получаете как резервное копирование данных в автономном режиме, так и резервирование без риска, связанного с RAID или устройством NAS. Отдельные накопители также предлагают более широкий диапазон совместимости, поскольку SATA вряд ли появится где-либо в ближайшее время.

1
irrational John

Если вы действительно хотите удостовериться, что не потеряете его, вам нужны как минимум два варианта архивирования. Вероятно, лента и жесткие диски. Создание только одной копии без какой-либо формы избыточности - это просто еще один способ бросать кубики данных.

Похожие вопросы