Мой RAID 10 Array поврежден, как мне вернуть мои данные?

710
Car12

У меня есть сервер с 4 дисками в массиве RAID 10. Недавно мой сервер не работал с массивом, не обнаружившим диски. В данный момент карта RAID видит только один диск, а второй диск отображается как недоступный. И 2 диска показывают несколько ошибок. К сожалению, у меня нет последней версии Offsite Backup.

Мне было рекомендовано клонировать массив RAID 10 с помощью Acronis, но есть вероятность, что он может клонировать данные, но не будет загрузочным, или он может полностью потерпеть неудачу в любой момент.

Какое самое безопасное решение для восстановления данных в этом случае. Я не хочу потерять свои данные.

0
Если 3 диска вышли из строя с 10, значит, вы уже превысили количество дисков, которые могут выйти из строя. Ramhound 6 лет назад 3
Спасибо за ваш ответ. Мой провайдер сказал мне, что Drive A & D недоступны. И другие могут потерпеть неудачу. Я могу попытаться восстановить массив, но есть вероятность, что диски будут терять данные во время процесса. Итак, каковы наиболее безопасные варианты восстановления данных? Car12 6 лет назад 1
Вы не сможете восстановить свой массив из-за количества дисков, которые не доступны и / или вышли из строя. У вас 0% вероятности восстановления данных с указанным количеством дисков, которые недоступны. Ramhound 6 лет назад 0
Все диски в данный момент отображаются. Массив был обнаружен еще раз, но в данный момент он находится в автономном режиме. Мне не удалось принудительно подключить массив к сети, поскольку он поврежден, и он отобразил сообщение о том, что сегментов недостаточно, чтобы подключить его к сети. Можно ли что-нибудь сделать в этом случае? Car12 6 лет назад 0
Смотрите мой оригинальный комментарий. Ramhound 6 лет назад 0
@Carmin: с четырьмя откликающимися, но неисправными дисками, вещи могут быть спасены, но это не будет ни быстрым, ни легким. Смотрите ответ TOOGAM (есть фирмы, которые делают это профессионально; в этом случае это не будет * дешево *). Вы все еще можете потерять некоторые файлы. Похоже, что ваш диск слишком долго работал с неисправным неисправным состоянием, пока неисправность не стала неисправимой; это может указывать на ошибку в процессе технического обслуживания / проверки. LSerni 6 лет назад 1
@Ramhound: Я вижу, что твоя репутация чуть больше 10 тысяч, когда я пишу это. Поздравляю с достижением этой вехи. Совет: вы четко знаете много. Я видел ваше имя в нескольких случаях. И в некоторых случаях, таких как этот, вы предоставили некоторую правильную (и, следовательно, полезную) информацию, но мне удалось получить больше репутации (например, несколько голосов за первые 20 минут моего ответа здесь). ) уделять больше времени предоставлению более подробных объяснений, которые могут быть более полезными для людей, которые знают меньше. (и, будучи полезным, вероятно, кажется более надежным в отношении того, что люди понимают меньше.) TOOGAM 6 лет назад 0
@TOOGAM Спасибо за ваш ответ. Вы имеете в виду, что в процессе обслуживания провайдером сервера может быть какая-то ошибка или ошибка? Я пользуюсь Managed Services, и мой провайдер серверов объяснил эту причину следующим образом: «Сбой работы ваших дисков из-за большого количества незавершенных секторов и перераспределенных секторов. Сбой диска произошел из-за общего использования». Car12 6 лет назад 0
@LSerni Спасибо за ваш ответ. Вы имеете в виду, что во время процесса обслуживания провайдером сервера может быть какая-то ошибка или ошибка? Я пользуюсь Managed Services, и мой провайдер серверов объяснил эту причину следующим образом: «Сбой работы ваших дисков из-за большого количества незавершенных секторов и перераспределенных секторов. Сбой диска произошел из-за общего использования». Car12 6 лет назад 0
Какие?!? Насколько «управляемыми» являются эти «управляемые услуги», которые вам предоставляются? Почему они не отреагировали на неисправное оборудование? Логи показывают, что накопители имели проблемы в течение некоторого времени? Им не удалось проверить то, что они согласились контролировать? Может быть, халатность не твоя вина, и они должны быть на крючке за это? (Документируйте данные, которые доступны вам сейчас, прежде чем стать явно враждебным, чтобы они не делали данные недоступными для вас.) Они по неосторожности не заметили? Какие услуги они должны предоставлять? Каковы их обязанности? Стоит ли подавать судебный иск? TOOGAM 6 лет назад 0
@TOOGAM Вот что они сказали мне: «Мы не ведем активный мониторинг состояния ваших дисков. Поскольку это была карта Adaptec, вы могли бы установить их диспетчер хранилища». Их управляемый сервис включает в себя проверку использования ЦП, ОЗУ и ввода-вывода и сообщения о любых проблемах. Так не следует ли сообщать об этой проблеме, если они отслеживают использование ввода-вывода? Car12 6 лет назад 0

1 ответ на вопрос

3
TOOGAM

Во-первых, знайте, что многие люди любят говорить: «RAID - это не резервное копирование». Причина, почему бизнес должен использовать RAID, состоит в том, чтобы минимизировать время простоя. Причина, по которой бизнес должен выполнять резервное копирование данных, заключается в возможности восстановить данные до предыдущей версии. Да, технически RAID 1, по сути, выполняет «резервное копирование» данных с одного диска на другой, но множество угроз для данных затронет не только один диск, но и оба. Итак, цели RAID и резервного копирования решают совершенно разные задачи, поэтому многие люди любят говорить: «RAID - это не резервное копирование».

В данный момент карта RAID видит только один диск, а второй диск отображается как недоступный. И 2 диска показывают несколько ошибок.

Я согласен с Ramhound. Похоже, вы обречены. Сожалею.

Если бы только у одного накопителя были проблемы, вы наверняка сможете с этим справиться. Однако, если вы хотите, чтобы вещи были восстановлены в «отличной форме», вам потребуется как минимум 2 диска (и они должны быть правильными!), Чтобы выполнить хорошее восстановление для такого сценария, как этот. Похоже, у вас 3 диска с проблемами (один не отвечает, а 2 других с ошибками). Если это так, у вас недостаточно работы, чтобы полностью ее решить (если вообще), и в этом случае вы обречены на потерю данных (возможно, катастрофически потерять все это). Если этот язык звучит слишком резко, тогда я извиняюсь: я не хочу быть нечувствительным, скорее я просто пытаюсь одобрить резкость и ясность.

Если вы пытаетесь восстановить RAID 1 (который состоит из двух частей), вам нужно восстановить из той части, в которой нет ошибок. В противном случае вы получите ошибки. Если вы не можете определить, на каких дисках возникли ошибки, вам может потребоваться начать резервное копирование всех дисков (используя побитовые / криминалистические копии, как упомянуто далее), чтобы при восстановлении с неправильными дисками Вы можете попробовать еще раз. Таким образом, вам может потребоваться достаточно свободного места для хранения, чтобы максимально безопасно справиться с этим.

Если постоянные усилия приведут к тому, что вы сможете снова заставить работать неработающий диск, и этот диск исправен, тогда, возможно, вы сможете получить хорошее восстановление, несмотря на два диска, которые не могут должным образом дать вам все данные. Это может быть возможно. Может быть. Остальная часть этого ответа исследует эту возможность.

К сожалению, терминология RAID не достаточно универсальна, чтобы мы могли понять, какие диски вы потеряли, основываясь только на информации, которую вы предоставили до сих пор. Вы упомянули об использовании RAID 10. Ну, это:

  • диск RAID 1, который затем был разделен на RAID 0,
  • или RAID 0, который затем был помещен в зеркало RAID 1?

Правильный ответ ...

это зависит от поставщика.

Ага. Мы просто не знаем. Я основываю этот вывод на статье PC Guide о уровнях нескольких RAID, в которых говорится, что RAID10 обычно означает RAID 1, а затем RAID 0 (что будет лучшим сценарием для вас), но некоторые ...

другие компании меняют условия! Они могут назвать RAID 0, а затем технологию RAID 1 «RAID 1/0» или «RAID 10» (возможно, из-за страха, что люди подумают, что «RAID 01» и «RAID 1» ​​- это одно и то же). Некоторые разработчики используют термины «RAID 01» и «RAID 10» взаимозаменяемо. Результатом всей этой путаницы является то, что вы должны исследовать, чтобы определить, что именно компания реализует, когда вы смотрите на несколько RAID. Не верь лейблу.

Поэтому в любое время, когда кто-то говорит RAID10, не доверяйте тому, что он сделал. Разберись.

Если у вас есть зеркала с полосками, значит, ваш макет выглядел так:

AB = RAID1
CD = RAID1
(зеркало двух RAID 1)

Затем потеря дисков A и D приводит к ухудшению, но функционированию каждого RAID1, и ваша полоса имеет обе части, так что все в порядке.

Если у вас есть зеркальные полосы, значит, ваш макет выглядит так:

AB = RAID0
CD = RAID0
зеркальный ...

Затем каждый RAID0 теряется, и вы отражаете два потерянных диска, так что у вас ничего нет.

К счастью, похоже, что большинство реализаций RAID10 будут зеркалами с полосками, так что шансы в вашу пользу.

Предполагая, что расположение является благоприятным для вас, вы хотите получить резервную копию дисков, прежде чем делать какую-либо перестройку. Позвольте мне уточнить: вы не хотите создавать резервные копии файлов. Вы не хотите создавать резервные копии разделов. Вы хотите сделать резервную копию дисков. Целые диски. Убедитесь, что ваш процесс резервного копирования выполняет полный «бит за битом» архив, иногда называемый «криминалистической копией», который копирует ВСЕ данные на диске, включая неиспользуемые биты и (что очень важно для вас) метаданные, такие как сигнатуры дисков, которые RAID-массив "программное обеспечение" может использовать. (Под «программным обеспечением» я не обязательно подразумеваю программу, хранящуюся на жестком диске, но логику, которая может быть встроена в некоторые ваши схемы в зависимости от того, какой RAID вы используете.)

Мне было рекомендовано клонировать массив RAID 10 с помощью Acronis.

Я не рекомендую Acronis из-за проблем, с которыми я столкнулся профессионально. Тем не менее, я знаю, что Acronis довольно популярен. Я предпочел бы в этом сценарии использовать любой Unix (который может включать загрузочный компакт-диск Acronis) и использовать dd, возможно, в сочетании с netcat (если диски являются удаленными). Для этого может потребоваться некоторое обучение, но если все пойдет гладко, у меня будет достаточно уверенности в конечном результате задачи резервного копирования (в зависимости от того, окажется ли целевой диск достаточно надежным).

есть вероятность, что он может клонировать данные, но не будет загрузочным, или он может полностью потерпеть неудачу в любой момент

Я бы сказал «да», эта угроза существует. Я верю, что иногда пересборки могут завершиться неудачей по не очень важным причинам ... и повторная попытка с другого диска может работать великолепно. Вот почему вы действительно, действительно, действительно должны получить очень чистую резервную копию, прежде чем начинать перестройку. Всегда проверяйте, что вы НЕ используете свою единственную копию каких-либо данных при запуске перестройки.

Как только у вас есть идеальное резервное копирование (которое вы можете довольно легко проверить, если аппаратное обеспечение все еще функционирует правильно, выполняя побитовое сравнение каждого байта на диске, что может быть проще сделать в Unix, чем в некоторых других операционных системах). ), тогда вам будет нечего терять, пытаясь восстановить. Поэтому будьте очень параноидальны в отношении того, что резервное копирование будет сделано правильно, но затем расслабьтесь во время (возможно) более продолжительного процесса восстановления. (На этом этапе ничто из того, что происходит во время процесса восстановления, не должно вызывать каких-либо проблем, если только у вас не возникнут проблемы с резервными копиями. Поэтому, помимо потери нескольких накопителей, должна быть еще одна маловероятная проблема, которая скорее вряд ли будет обречен ... если твоя резервная копия была сделана хорошо.)

После того, как вы проверите, что восстановление отчетов об успехе, убедитесь, что ваши данные, кажется, восстановлены в порядке (проверьте данные из разных разделов, надеясь проверить несколько дисков), а затем не считайте, что ваш процесс «исправить эту проблему» завершен, пока вы иметь рабочее решение для резервного копирования.

Мне нравится этот ответ. Не могли бы вы немного подробнее разобраться с `dd` (например, почему бы не` ddrescue`?)? Хороший красный цвет из вики подойдет, но я предполагаю, что все, кто находится в ситуации деградации RAID, будут близки к нервному срыву (я знаю, что я буду ;-)), так что дать им уверенность в своих возможностях возможно лучший способ защитить их от полной потери данных. flolilolilo 6 лет назад 0
`ddrescue`: похоже, что может быть физический ущерб, поэтому: хорошее предложение. Он реже легко доступен в различных загрузочных системах Unix. Это неудобство, возможно, стоит преодолеть, чтобы восстановить ценные данные. Мой ответ был написан с целью стремиться к полному выздоровлению, поэтому я отметил «если все пойдет гладко», когда я обсуждал «dd». Я ожидаю, что пропуск только некоторых данных на диске будет иметь усиленный негативный эффект (будучи более склонным к возникновению проблем с большим количеством данных), когда RAID0 является частью картины. Может быть, это даже повлияет на процесс восстановления? TOOGAM 6 лет назад 1
@flolilolilo: о "re [a] d from wiki": я опубликовал свое собственное руководство по резервному копированию с w / dd & netcat, поэтому я не собираюсь вкладывать усилия в поиск других сторонних документов для гиперссылки на , На самом деле, этот ответ уже включает некоторую информацию, которую я только что нашел из части моей собственной онлайн-документации. Когда я впервые присоединился к Stack Exchange, модераторы жаловались на то, что мои публикации слишком часто ссылаются на мои собственные онлайн-документы, поскольку они преследовали цель захвата трафика. Поэтому я веду себя (иногда не отвечая, @ иногда @ - это печально влияет на качество моих ответов), указывая на мой собственный сайт только * крайне редко *. TOOGAM 6 лет назад 0
** Относительно "re [a] d from wiki": ** О, я вижу. Я должен признать, что я не знал о «проблеме» генерации трафика. Тогда полный вывод из моей заявки! ** Относительно `ddrescue`: ** Мои знания о спасении данных являются исключительно непрофессиональными, поэтому я бы пошел на все, что вы говорите, и восполнил пробелы знаниями из других сайтов, не смея заявить об этом здесь (из-за отсутствия уверенность в собственных, еще не утвержденных знаниях). flolilolilo 6 лет назад 0
@flolilolilo: Остерегайтесь давать кому-то слишком много кредитов; только то, что они, кажется, знают немного, не означает, что они точны во всем, что говорят. В моем случае я очень стараюсь быть точным, но последние два предложения моего комментария ddrescue (начиная с «я бы ожидал») основаны больше на моем собственном чтении, чем на реальном профессиональном опыте. TOOGAM 6 лет назад 0

Похожие вопросы