Raid1, еще три диска, решение для мультитерабайтных установок в малом бизнесе?

356
John S.

С учетом соотношения пространства и стоимости жестких дисков, приводящего к емкостям, которые представляют все большую проблему для систем Raid с четностью (вероятность URE, многодневная перестройка жестких дисков и риск вторичного отказа), есть основания полагать, что они также предоставляют возможность / рекомендации для многодисковых (> 2) конфигураций Raid 1 для использования дома и в малых компаниях? То есть, пространство RAID1 «отходы» по сравнению со схемой контроля четности, но с дешевыми дисками многоплатформенного терабайта, этим пространство не возможно, товара у нас есть, чтобы тратить по сравнению с памятью, пропускной способностью, тактовые, время простоя и т.д., необходимой в чередовании, перестраивает и т.д. ,

Если я правильно понимаю технологию, конфигурация Raid 1 (> 2):

  • ..не может произойти сбой перестроения, если доступны только один диск и файлы.
  • ... обеспечивает большую безопасность относительно количества дисков. Это в основном инверсия отношения правильно? Raid5 на трех дисках обеспечивает 66% полезной емкости и может справиться с ошибкой 33% (1 диск). Raid1 обеспечивает только 33% емкости, но 66% отказа (2 диска).
  • ... имеет более простой и надежный механизм восстановления. В тяжелых условиях Raid не нужно перестраивать для доступа к данным. Диски можно переносить между разными системами.

Этот последний момент напоминает философию unRaid, в которой файлы сохраняются на разных дисках, а не в полосках, а второй пункт предлагает мне нечто более привлекательное для малого бизнеса; приоритет безопасности данных над емкостью данных. Какой смысл хранить больше данных, если они подвергаются большему риску?

Вопросы:

  1. Сможет ли стратегия «ручного зеркалирования» контента, в отличие от копирования Raid1 во время записи, избежать потенциальных проблем с повреждением памяти не-ECC? Поскольку задание записи на каждый диск было бы отдельным процессом, то та же ошибка памяти, которая возникает при одной записи, теоретически не возникает при другой?

  2. Существует ли программное / аппаратное обеспечение Raid1, предназначенное для работы с более чем двумя накопителями, и, следовательно, может ли оно обрабатывать традиционно не похожие на raid1 поведения, такие как бит-гниль, URE и т. Д.? При традиционной настройке зеркала диска, если диск A сообщает 0, а B сообщает 1, вы понятия не имеете, кто перевернул, но в решении с тремя или более дисками вы не могли бы «исправить» диск с нечетным диском? A = 0, B = 1, C = 0, таким образом, B должно быть перевернуто?

  3. В то же время, будет ли такое решение Raid1 поддерживать параллельное чтение с более чем двух дисков, чтобы обеспечить ускоренную скорость чтения? Это особенно важно, поскольку я полагаю, что многие компании читают одни и те же данные гораздо чаще, чем редактируют.

  4. Рейд не является решением для резервного копирования. Так что, если вы будете следовать хорошей практике и иметь 2-3 хранилища, предполагается ли, что только один из них защищен от сбоя диска с помощью рейд-схемы, или вы ожидаете, что во втором удаленном хранилище также будет избыточность нескольких дисков? Это тот случай, когда даже один диск, хранящийся в другом месте, считается защищенным от сбоя устройства, потому что он находится в «эффективном» зеркальном отношении с дисками в других местах? Если нет, то Raid1 не предлагает некоторую избыточность для наименьшего минимального количества дисков (2)?

Обновить:

В отношении пункта 1, как отмечают некоторые, это зависит от источника данных без ошибок. Однако это касается практически любой стратегии хранения / резервного копирования. Мы можем использовать сложные системы для обеспечения целостности данных в наших решениях NAS / SAN, но данные, которые мы храним в них, обычно генерируются рабочими станциями и устройствами без таких мер. Большинство производственных ПК созданы либо для стоимости, либо для скорости. Крайне маловероятно, особенно в малом бизнесе, что компьютер, на котором вы работаете в САПР, на котором вы работаете, финансируете, или на что-то другое, использует диски в формате ZFS и память ECC.

В моем конкретном примере одной из вещей, которые я буду искать для сохранения, будет вывод с камеры. Я должен предположить, что фотографии и видео, которые он сохраняет на SD-карте, являются «правильными», и я мало что могу сделать, если повреждение происходит в точке цепочки данных.

Предложение:

Если эта стратегия не поддерживается на уровне RAID, существуют ли какие-либо программные пакеты, которые можно использовать для ручного выполнения некоторых операций, о которых я говорю? Написание копий с помощью поставленных в очередь дискретных заданий rysnc? Сценарий bash может выполнять периодическую чистку? Просто контрольную сумму всех копий определенного файла на всех дисках, а затем перезаписать копию на диске с неправильной контрольной суммой, используя копию на правильном диске?

0
Возможно, я упускаю суть / цель вашего подвопроса № 1. Если происходит повреждение данных при записи на ваш основной (первый) диск, а затем вы копируете файл на второй диск, разве это не скопирует поврежденные данные, которые были записаны на первый диск? Scott 6 лет назад 0
Что есть много вопросов .... Смотрите https://superuser.com/questions/489793/can-raid-1-have-more-than-two-drives для потенциального дубликата, хотя .... Pimp Juice IT 6 лет назад 1
RAID 6 также обеспечивает 2 отказа дисков. Издержки RAID 5 равны +1, а RAID 6 +2, поэтому накладные расходы уменьшаются по мере увеличения количества дисков. Так как общее количество дополнительных дисков остается прежним. cybernard 6 лет назад 0
Если бы вы записали в цепочку свои записи, вы были бы правы. Так что запись с источника на диск 1, затем диск 1 на диск 2 и т. Д. Будет увековечить ошибку. Однако, если вы читаете и пишете на каждый диск из источника отдельно, вы могли бы избежать этой проблемы? Очевидно, источник, содержащий исходные данные, должен быть верным. John S. 6 лет назад 0
Извиняюсь за многие вопросы. Здесь есть несколько тем, которые могут быть дубликатами, но ни одна из тех, которые я видел, не затрагивала эти конкретные вопросы. Лучше всего я понял, что пока никто не может назвать аппаратный контроллер, который обеспечивает эту функциональность, и что Linux mdadm поддерживает Raid1 с более чем двумя дисками, но не предлагает никаких дополнительных функциональных возможностей при работе с> 2 конфигурациями. John S. 6 лет назад 0
Пункт 3. Если вы действительно хотите, чтобы скорость SSD составляла 500-550 Мбит / с, чтение и 450 Мбит / с. SSD M.2 - запись 2000-3000 и запись 1500-2500. Эти скорости будут намного превышать то, что вы можете получить за дешевый RAID. Тем не менее, вы можете использовать RAID для еще более высоких скоростей. cybernard 6 лет назад 0
Raid6 обеспечивает два отказа дисков, но с более высоким минимальным количеством дисков и с вычислением четности и чередованием работает с большим риском во время восстановления; проблема усугублялась большими возможностями, что было сутью моего расследования. Дело не только в том, сколько дисков может выйти из строя, но и в том, что произойдет, если они выйдут из строя. Мне предложили эту статью: https://www.zdnet.com/article/why-raid-6-stops-working-in-2019/ John S. 6 лет назад 0
Ну, скорость - это всего лишь бонус к централизованной системе хранения. Очевидно, что Raid1 / 5/6 обычно в NAS предназначен для защиты данных, и, несмотря на разработку SSD, такие системы в целях надежности и размера все еще имеют тенденцию использовать жесткие диски 3.5. John S. 6 лет назад 0
@JohnS. У SSD также нет двигателя, чтобы выйти из строя, и у меня было много жестких дисков с неисправным двигателем. Таким образом, они также более надежны и не чувствительны к любому обычно испытываемому количеству вибрации. Все больше и больше компаний переходят. cybernard 6 лет назад 0

2 ответа на вопрос

0
davidgo

Ответить на вопросы

  1. Зеркальное отображение содержимого вручную может обойти некоторые потенциальные проблемы, связанные с ECC, но может привести к появлению других. Также предполагается, что исходные данные не были повреждены из-за более раннего сбоя.

  2. Это зависит от аппаратного / программного обеспечения. Я полагаю, что большинство реализаций RAID1 не воспримут bitrot, но будут обрабатывать URE. Чтение части данных, как правило, выполняется только с одного из дисков, а не со всех, что позволяет в целом выполнять более быстрое считывание.

  3. Если RAID1 поддерживает все 3 диска, да, параллельное чтение будет быстрее с большим количеством дисков. AFAIK это не поддерживается в mdadm (т.е. решениях на основе программного обеспечения Linux raid), так как 3-й диск считается горячим резервом.

  4. Независимо от того, используете ли вы RAID ваше удаленное местоположение, это вопрос надежности и надежности. Это была бы лучшая практика, но не абсолютная необходимость. На мой взгляд, жесткие диски являются расходными деталями - наличие RAID позволяет заменять сбои без необходимости восстановления и повышает долговечность. Это действительно будет обсуждение затрат и выгод.

Мысль (но не ответ) - Рассматривали ли вы альтернативные технологии RAID? ZFS (отлично подходит для моментальных снимков / pitr и репликации вне сайта), MooseFS или аналогичные должны позволять блоки с распределенной избыточностью, но с меньшим количеством оборудования, даже LVM может обеспечивать зеркалирование - при использовании вместе с MDADM он может обеспечить решение типа RAID1 для 3 дисков. davidgo 6 лет назад 0
Спасибо за такой исчерпывающий ответ. Можете ли вы уточнить, какие типы проблем могут возникнуть при ручном зеркалировании, и как, по-вашему, будет происходить обработка URE? Простой, поскольку контроллер будет пытаться читать с одного диска и автоматически перемещать чтение на другой, если он столкнется с URE? John S. 6 лет назад 0
Вы правы, что в ZFS зеркальный vdev поддерживает контрольные суммы и несколько дисковых устройств (http://www.zfsbuild.com/2010/05/26/zfs-raid-levels/). Было бы интересно выяснить, имеет ли эта схема меньшие издержки (ZFS очень интенсивно использует ОЗУ), чем гораздо более распространенные схемы RaidZ, RaidZ2 и RaidZ3. John S. 6 лет назад 0
0
Hennes

Начнем с предположений:

Если я правильно понимаю технологию, конфигурация Raid 1 (> 2):

..не может произойти сбой перестроения, если доступны только один диск и файлы.

Это действительно так, но это не защищает от ударов молнии, кражи, наводнения и т. Д. Таким образом, хотя вы уменьшаете один риск, вам все равно нужны резервные копии за пределами площадки.

... обеспечивает большую безопасность относительно количества дисков. Это в основном инверсия отношения правильно? RAID5 на трех дисках обеспечивает 66% полезной емкости и может обработать сбой на 33% (1 диск). Raid1 обеспечивает только 33% емкости, но 66% отказа (2 диска).

Это предполагает, что отказ диска не зависит. На SAS это может иметь место (если диск не выходит из строя и не повреждает другие диски), но это не относится к PATA или SATA. Обычно зависший диск означает, что все диски на этом контроллере будут зависать. У вас все еще будут ваши данные, но у вас также будет время простоя.

... имеет более простой и надежный механизм восстановления. В тяжелых условиях RAID не нужно перестраивать для доступа к данным.

Большую часть времени восстановление не является проблемой. Никто не перестраивает RAID-массивы. С терабайтными дисками быстрее заменить диск, воссоздать массивы с вашими данными и восстановить из резервной копии.

С точки зрения бизнеса средняя цель RAID - поддерживать работоспособность системы до 17:00, а затем убедиться, что ежедневное резервное копирование работает, за ним следует новый диск, новый массив RAID и восстановление из резервной копии.

Диски могут быть перенесены между различными системами

Это во многом зависит от реализации RAID. Это может сработать. Может и нет.


Сможет ли стратегия «ручного зеркалирования» контента, в отличие от копирования RAID1 во время записи, избежать потенциальных проблем с повреждением памяти без ECC? Поскольку задание записи на каждый диск было бы отдельным процессом, то та же ошибка памяти, которая возникает при одной записи, теоретически не возникает при другой?

Если вам повезет. Но что помешает вам успешно и бесповоротно скопировать поврежденный файл?

Существует ли программное / аппаратное обеспечение RAID1, предназначенное для работы с более чем двумя дисками, и, следовательно, способное обрабатывать традиционно не-raid1-подобное поведение, такое как бит-гниль, URE и т. Д.? При традиционной настройке зеркала диска, если диск A сообщает 0, а B сообщает 1, вы понятия не имеете, кто перевернул, но в решении с тремя или более дисками вы не могли бы «исправить» диск с нечетным диском? A = 0, B = 1, C = 0, таким образом, B должно быть перевернуто?

Существует их «RAID1-аромат» под названием RAID5 ....

Если серьезно, то на ум приходят RAID3,4,5 и RAID6. Нет необходимости заставлять зеркало в чем-то другом.

В то же время, будет ли такое решение RAID1 поддерживать параллельное чтение с более чем двух дисков, чтобы обеспечить ускоренную скорость чтения? Это особенно важно, поскольку я полагаю, что многие компании читают одни и те же данные гораздо чаще, чем редактируют.

RAID 5 будет. И RAID 6, и ...

RAID не является решением для резервного копирования. Таким образом, если вы будете следовать хорошей практике и иметь от 2 до 3 хранилищ, предполагается ли, что только один из них защищен от сбоя диска с помощью схемы RAID, или вы ожидаете, что второе удаленное хранилище также будет иметь избыточность нескольких дисков?

Я хотел бы резервное копирование в автономном режиме . Один недоступен через Интернет и в другом месте. Вторая резервная копия, которая доступна и обновляется ежедневно, также хороша. Но в основном в случае пожара и тому подобного.

Хорошим дополнением к этому было бы частичное резервное копирование в автономном режиме и ежедневное резервное копирование на ленту / диск / облако.

Это тот случай, когда даже один диск, хранящийся в другом месте, считается защищенным от сбоя устройства, потому что он находится в «эффективном» зеркальном отношении с дисками в других местах?

RAID не резервный. Часть RAID не является надлежащей резервной копией. Даже диск от многодискового зеркала. В зависимости от вашей реализации RAID это может работать или не работать. Правильная резервная копия всегда работает. Даже после обновления программного обеспечения (например, драйверы RAID).

Если нет, то не обеспечивает ли RAID1 некоторую избыточность для наименьшего минимального количества дисков (2)?

Он предлагает избыточность для недоступного сектора или сломанного диска.

И это все, что обычно требуется. Достаточно избыточности, чтобы все работало и работало, пока вы не сможете выполнить экстренное обслуживание.