Debian / 3ware 9500 - сбой RAID?

513
Gargravarr

Вчера вечером я сменил жесткие диски со своего домашнего сервера на новый корпус (новый mobo / CPU / RAM) и перенес с ним его 3ware 9500 PCI-X SATA RAID карту. Машина имеет 4 диска, настроенных на 2 RAID1 - корневой (500 ГБ) и носитель (1 ТБ). Он работает под управлением Debian 7 32-bit.
Машина загрузилась нормально, но только когда она работала и загрузились утилиты 3ware, я заметил, что в массиве отсутствует один из корневых дисков. Я выключил его и покачал диски (я знаю, что этот диск временный, мне нужно купить новый) и в итоге получил карту RAID, чтобы увидеть его. Это означало запуск перестройки RAID, поэтому я позволил машине перезагрузиться в Debian, чтобы я мог следить за ее ходом и начать перестройку.
Он достиг диапазона 90%, прежде чем мне пришлось заняться чем-то другим. Когда я вернулся, катастрофа - на карте RAID не было ни RAID, ни дисков. Debian все еще работал (как-то!), Но я ничего не мог сделать. Громкость носителя исчезла, и корневая FS казалась полностью поврежденной - bash интерпретировал двоичные файлы системы как случайные строки чисел. Больше ничего не оставалось, кроме перезагрузки (и это должна была быть жесткая перезагрузка, команда выключения не работала).
Карта RAID детализировала все 4 присутствующих диска, но этот проблемный диск все еще не использовался, а это значит, что ручная перестройка RAID все еще была необходима. Когда появился Grub, он объявил, что не может распознать файловые системы ни на одном из моих RAID-массивов, поэтому дал мне оболочку восстановления - я понятия не имею, как использовать это (мой интернет тоже не работал вчера вечером), поэтому я понятия не имею в каком состоянии находятся мои диски. Я удалил хороший корневой диск и попытался перевести систему в режим деградации на временном диске, чтобы посмотреть, есть ли на нем какие-либо полезные данные, но карта RAID отказалась разрешить мне использовать его как загрузочный носитель.
При необходимости у меня есть адаптер USB-SATA, но на данном этапе мне интересно, каковы мои шансы на восстановление системы; Я знаю, что RAID не заменит резервное копирование, но на этих дисках есть много данных, на восстановление которых у меня уходит очень много времени (то есть они не незаменимы, но я не хочу стереть систему и начать заново), Любые идеи, где я мог бы начать?

Изменить: достигнут некоторый прогресс. Похоже, что «хороший» диск из корневой пары перенес аппаратный сбой в середине восстановления! Я попытался перенести его на новый диск и получил ошибки ввода-вывода, и SpinRite не хочет его трогать. «Плохой» диск находится в каком-то подвешенном состоянии, но один из разделов на нем передал fsck и монтируется на живой диск, так что я перенес это на запасной диск. Это не объясняет, почему пропали два других медиа-диска, но спасение раздела / home - отличное начало.

Редактировать 2: здесь происходит что-то очень странное. Два медиа-диска не будут отображаться в BIOS на моем рабочем столе, и через USB на моем ноутбуке они оба будут отображаться без таблицы разделов. Я начинаю задаваться вопросом, умерли ли как-то три из этих четырех дисков одновременно, или они были убиты новым оборудованием - если так, я не могу понять, почему, единственное, о чем я могу думать, скачок напряжения но это должно было поджарить Мобо первым!

Правка 3: в дополнение к моему последнему комментарию проблема с необнаруженными дисками, по-видимому, связана с тем, как карта 3ware использует их; диски мультимедиа отображаются нормально с контроллером 3ware с неповрежденными таблицами разделов. fsck'ing их сейчас, скрестив пальцы, я могу получить данные ...

Редактировать 4: я смог спасти все с медиа-дисков, хотя мне пришлось выполнить обширный fsck на разделе перед его монтированием. Было много ошибок с несовпадающими или недействительными индексами и подсчетом свободного места. Странно то, что на самом деле ничто не должно было использовать диски в то время. Хорошо, Plex Media Server был запущен, но поскольку я не касался какого-либо носителя на диске, я не думаю, что это могло повлиять на состояние файловой системы, когда RAID отключился. Я собираюсь попытаться войти в действительный корневой диск, посмотреть, что говорят логи. Пока я не определю, что привело к исчезновению RAID, я вернусь к программному RAID.

0
Вы можете делать побитовое копирование, используя DD для копирования данных с каждого отдельного диска на новый диск (или даже виртуальный диск, если он у вас есть). Это должно сохранить состояние RAID до тех пор, пока вы не найдете достаточно запасных частей. CIA 10 лет назад 0

1 ответ на вопрос

0
Gargravarr

Мои данные все еще были на дисках. Я понятия не имею, что их уничтожило, но теперь я настороженно отношусь к аппаратным контроллерам. Я перестроил машину с помощью программного RAID и вернул все восстановленные данные на место. Я не знаю, с чего начать, если у кого-то еще есть эта проблема.

Аппаратный RAID отлично подходит, если у вас есть доступ к запасной карте RAID. Иначе это становится еще одной единственной точкой отказа. (Пишет человек, у которого был отказавший 3ware 9650, который умер без замены. К счастью, 9750 читает диски из 9650). Hennes 10 лет назад 0
@Hennes У меня есть запасная карта 9500S на другом (неактивном) сервере, но с тех пор я прочитал несколько предостерегающих рассказов об использовании карт 3Ware в Linux - я не знаю, так ли это до сих пор, но, очевидно, производительность снижается без взлома в новом драйверы или модификация ядра. Я пока остановлюсь на mdadm, новое оборудование достаточно быстрое. Спасибо за совет, хотя Gargravarr 10 лет назад 0
У меня не было никаких других карт. Это было на моем домашнем ноутбуке, где я использовал карты, так как казалось, что он хорошо работает как с Windows, так и с FreeBSD. Оба из которых я бежал изначально. Хотя поддержка 3ware / LSI была удивительной (что после опыта работы с некоторыми другими неназванными поставщиками заслуживает упоминания). Hennes 10 лет назад 0

Похожие вопросы