Почему RAID-контроллер не может имитировать действия контроллеров дисков на URE?

370
Damon

Существует факт: URE отображает весь элемент массива RAID как плохой, но URE НЕ отображает весь диск как плохой вне массива. Какая техническая разница вызывает это? Они оба выглядят одинаково на уровне ОС, поэтому должно быть что-то ниже ОС и форматирования.

Насколько я понимаю, когда один из элементов RAID 5 выходит из строя, контроллер RAID начинает восстанавливать замененный диск, сравнивая другие значения вместе с проверкой четности, чтобы записать правильное значение на новый диск. Когда происходит URE, «он» воспринимает «поврежденные данные» через «ошибку чтения», «он» не может исправить «ошибку чтения» и останавливает восстановление и помечает второй элемент как плохой. Если у вас есть одна избыточность, это делает массив непригодным для использования.

Почему массив ВЕСЬ непригоден для использования с URE? Почему не только эта полоса информации? Кажется, что местоположение в массиве можно легко заметить, проверена таблица файлов и перечислены поврежденные файлы, так что поврежденные файлы могут быть снова добавлены в массив из резервных копий.

Например, на одном диске контроллер накопителя просто пометит сектор как плохой и продолжит работу; контроллер накопителя НЕ помечает весь диск и разделы в нем как «плохие». Почему контроллер RAID не может имитировать это и иметь такой же или похожий результат?

Кроме того, второстепенный вопрос для фонового режима, который может иметь отношение к URE, представляет собой «серьезную ошибку», при которой каждое чтение из одного и того же сектора завершается неудачно (связано с пластинами), или ошибка «мягкого чтения», которая произошла один раз (связана с передачей данных), но данные на Блюдо все еще хорошо? Если последнее, то возникнет вопрос, почему бы просто не попробовать снова? Или это первое?

Почему RAID-контроллер не может имитировать действия контроллеров дисков на URE?

Tl; Dr

Этот вопрос фактически является тем же вопросом, но разглагольствование, казалось, отбросило ответ и тон всей нити в сторону. «Ответы» на «Цель RAID - сохранить работоспособность файловой системы после того, как диск умирает. Не заменять резервную копию, чтобы гарантировать успешное восстановление». и «Неисправимая ошибка чтения при чтении источника, из которого вы строите, тогда невозможно правильно перестроить массив из этого поврежденного источника». не отвечайте на этот вопрос.

Здесь нет разглагольствования. Должно быть некоторое принципиальное техническое различие между тем, как контроллер RAID «видит» вещи, по сравнению с одним диском, который должен вызывать такое поведение; что это за техническая разница? Я могу логически ответить на свой вопрос; Контроллер рейда рассматривает массив как единое целое, в котором привод думает о вещах с точки зрения отдельных секторов. Но кажется, что это можно обойти, подобно тому, как один диск делает вещи и позволяет вещам снова быть пригодными для использования, поэтому я должен что-то упустить.

Эта тема в Spiceworks намекает на то, что существует реальная проблема с URE, но она запутана. Много ссылок в теме, чтобы следовать, хотя.

0
Подходящий RAID-контроллер ни в коем случае не пинает диск просто потому, что он сталкивается с неисправимой ошибкой чтения. Ваш вопрос основан на опыте или предположении? Twisty Impersonator 6 лет назад 0
@TwistyImpersonator "Предположение". Есть много статей и отчетов по URE, которые сделают массив RAID 5 непригодным для использования по «некоторой» причине; Отсюда широко разрекламированный отход от RAID 5 из-за URE. Однако я всегда открыт для того, чтобы ошибаться! Damon 6 лет назад 0
Справедливо. Наиболее распространенная причина, по которой RAID-контроллер запускает диск при обнаружении «одной» неисправимой ошибки, заключается в том, что на диске отсутствует прошивка, совместимая с RAID. В этом случае накопитель пытается исправить ошибку, на что может потребоваться до 30 секунд, в течение которых контроллер RAID (который ожидает, что такие ошибки будут сообщены, но не исправлены накопителем), «сдастся» на накопителе. и выкинуть его из массива, полагая, что весь блок потерпел неудачу. Twisty Impersonator 6 лет назад 0
Было бы полезно связать один или два наиболее надежных источника, на которых основан ваш вопрос. Twisty Impersonator 6 лет назад 0
@TwistyImpersonator Добавлена ​​ссылка на вопрос. Damon 6 лет назад 0
Я прочитал часть этого связанного поста, и кажется, что он оспаривает чье-то утверждение о том, что массивы * RAID 5 почти всегда не смогут ** восстановить *. Как вы видите, что это способствует вашему вопросу? Twisty Impersonator 6 лет назад 0
Далее в теме упоминается, что оба URE не «вызываются» как таковые; например, иногда это просто зависшая система по неизвестной причине или неудачная перестройка, но, между прочим, диск выглядит нормально. Дело в том, что URE случаются, но мы просто не знаем, когда и не можем получить хорошее доказательство того, что, почему и что дает. Damon 6 лет назад 0

0 ответов на вопрос