Программный RAID не работает после отключения питания
413
Uze
Мой сервер потерял питание вчера. Он автоматически загрузился, когда питание вернулось, но мой RAID теперь не работает.
Массив RAID - это программный RAID6, созданный с использованием mdadm. Первоначально в массиве использовалось 8 дисков. Несколько месяцев назад я заметил, что диск не прошел тестирование SMART, поэтому я заменил его. При замене диска я добавил еще 4 диска, которые изначально были на моем предыдущем сервере и отформатированы как ZFS (как часть FreeNAS RAIDZ), в результате чего общее количество дисков достигло 12.
К сожалению, я не помню точных команд, которые я использовал для расширения массива, и эта команда больше не находится в моей bash_history. Я не знаю, почему сегодня mdadm сообщает о 8 дисках, а fdisk сообщает об этих 4 дисках как о ZFS; Я уверен, что в течение последних нескольких месяцев у меня была 12-дисковая установка RAID.
Насколько я знаю, мой сервер не выключался и не перезагружался с момента замены неисправного диска и добавления 4 дополнительных дисков до вчерашнего дня.
Единственные команды mdadm, связанное что я забежавшая с потери мощности являются mdadm --detail /dev/md0, mdadm --stop /dev/md0и mdadm --assemble --scan -v. Я не перезагрузил сервер.
Я понимаю, что мне нужна резервная копия, и я буду реализовывать ее как можно скорее. Сейчас я просто надеюсь, что есть способ восстановить мои данные.
Я использую Debian 9 и mdadm 3.4.
Я рад предоставить любую другую информацию. (Обратите внимание, что я никоим образом не считаю себя экспертом по RAID или mdadm.)
Обновление: я добавил вывод проверки mdadm для "хороших" / "плохих" дисков. «Хорошие» диски правильно сообщают raid6 и 12 дисков.
mdadm --detail / dev / md0
(Примечание: это было при загрузке, перед запуском mdadm --stop /dev/md0. Также обратите внимание, что он сообщает raid0.)
/dev/md0: Version : 1.2 Raid Level : raid0 Total Devices : 8 Persistence : Superblock is persistent State : inactive Name : blackcanary:0 (local to host blackcanary) UUID : 7bd22c29:465d927f:d0c1d08f:ba3694c9 Events : 72036 Number Major Minor RaidDevice - 8 64 - /dev/sde - 8 32 - /dev/sdc - 8 0 - /dev/sda - 8 112 - /dev/sdh - 8 80 - /dev/sdf - 8 48 - /dev/sdd - 8 128 - /dev/sdi - 8 96 - /dev/sdg
fdisk -l
(Примечание: / dev / sdb и / dev / sdj - единственные два диска, которые НЕ должны быть в массиве.)
mdadm: looking for devices for /dev/md0 mdadm: No super block found on /dev/sdn2 (Expected magic a92b4efc, got b1f5ae15) mdadm: no RAID superblock on /dev/sdn2 mdadm: No super block found on /dev/sdn1 (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdn1 mdadm: No super block found on /dev/sdn (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdn mdadm: No super block found on /dev/sdm2 (Expected magic a92b4efc, got fd87a884) mdadm: no RAID superblock on /dev/sdm2 mdadm: No super block found on /dev/sdm1 (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdm1 mdadm: No super block found on /dev/sdm (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdm mdadm: No super block found on /dev/sdl2 (Expected magic a92b4efc, got 946313cc) mdadm: no RAID superblock on /dev/sdl2 mdadm: No super block found on /dev/sdl1 (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdl1 mdadm: No super block found on /dev/sdl (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdl mdadm: No super block found on /dev/sdk2 (Expected magic a92b4efc, got 4de36623) mdadm: no RAID superblock on /dev/sdk2 mdadm: No super block found on /dev/sdk1 (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdk1 mdadm: No super block found on /dev/sdk (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdk mdadm: No super block found on /dev/sdj (Expected magic a92b4efc, got 0000043c) mdadm: no RAID superblock on /dev/sdj mdadm: No super block found on /dev/sdb3 (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdb3 mdadm: No super block found on /dev/sdb2 (Expected magic a92b4efc, got 00000405) mdadm: no RAID superblock on /dev/sdb2 mdadm: No super block found on /dev/sdb1 (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdb1 mdadm: No super block found on /dev/sdb (Expected magic a92b4efc, got 00000000) mdadm: no RAID superblock on /dev/sdb mdadm: /dev/sdi is identified as a member of /dev/md0, slot 7. mdadm: /dev/sdh is identified as a member of /dev/md0, slot 6. mdadm: /dev/sdg is identified as a member of /dev/md0, slot 5. mdadm: /dev/sdf is identified as a member of /dev/md0, slot 4. mdadm: /dev/sda is identified as a member of /dev/md0, slot 2. mdadm: /dev/sdc is identified as a member of /dev/md0, slot 0. mdadm: /dev/sde is identified as a member of /dev/md0, slot 3. mdadm: /dev/sdd is identified as a member of /dev/md0, slot 1. mdadm: added /dev/sdd to /dev/md0 as 1 mdadm: added /dev/sda to /dev/md0 as 2 mdadm: added /dev/sde to /dev/md0 as 3 mdadm: added /dev/sdf to /dev/md0 as 4 mdadm: added /dev/sdg to /dev/md0 as 5 mdadm: added /dev/sdh to /dev/md0 as 6 mdadm: added /dev/sdi to /dev/md0 as 7 mdadm: no uptodate device for slot 8 of /dev/md0 mdadm: no uptodate device for slot 9 of /dev/md0 mdadm: no uptodate device for slot 10 of /dev/md0 mdadm: no uptodate device for slot 11 of /dev/md0 mdadm: added /dev/sdc to /dev/md0 as 0 mdadm: /dev/md0 assembled from 8 drives - not enough to start the array.
mdadm.conf
# mdadm.conf # # Please refer to mdadm.conf(5) for information about this file. # # by default (built-in), scan all partitions (/proc/partitions) and all # containers for MD superblocks. alternatively, specify devices to scan, using # wildcards if desired. #DEVICE partitions containers # automatically tag new arrays as belonging to the local system HOMEHOST <system> # instruct the monitoring daemon where to send mail alerts MAILADDR root # definitions of existing MD arrays # This configuration was auto-generated on Sun, 25 Jun 2017 22:28:24 -0500 by mkconf ARRAY /dev/md0 metadata=1.2 name=blackcanary:0 UUID=7bd22c29:465d927f:d0c1d08f:ba3694c9
mdadm - проверить / dev / sdd
(Примечание: очень похожая информация возвращается для любого из «хороших» 8 дисков)
/dev/sdd: Magic : a92b4efc Version : 1.2 Feature Map : 0x1 Array UUID : 7bd22c29:465d927f:d0c1d08f:ba3694c9 Name : blackcanary:0 (local to host blackcanary) Creation Time : Sun Jun 25 22:53:12 2017 Raid Level : raid6 Raid Devices : 12 Avail Dev Size : 7813780144 (3725.90 GiB 4000.66 GB) Array Size : 39068897280 (37259.00 GiB 40006.55 GB) Used Dev Size : 7813779456 (3725.90 GiB 4000.66 GB) Data Offset : 257024 sectors Super Offset : 8 sectors Unused Space : before=256936 sectors, after=688 sectors State : clean Device UUID : 91d8e433:aeb9a4f2:75ca10cf:3ceb0a83 Internal Bitmap : 8 sectors from superblock Update Time : Sun Oct 7 14:23:36 2018 Bad Block Log : 512 entries available at offset 72 sectors Checksum : b960e905 - correct Events : 72036 Layout : left-symmetric Chunk Size : 512K Device Role : Active device 1 Array State : AAAAAAAAAAAA ('A' == active, '.' == missing, 'R' == replacing)
mdadm - проверить / dev / sdk
(Примечание: та же информация возвращается для любого из «плохих» 4 дисков)
Проверьте, показывает ли `sudo fdisk -b 512 -t gpt -l / dev / sdn` или` sudo fdisk -b 4096 -t gpt -l / dev / sdn` ожидаемые разделы.
grawity 5 лет назад
0
Я добавил вывод обоих в исходное сообщение. Некоторое замешательство с моей стороны заключается в том, что я не ожидал увидеть разделы для sd [kn], учитывая, что на других дисках нет списка разделов.
Uze 5 лет назад
0
1 ответ на вопрос
0
Uze
После долгих исследований я смог восстановить RAID-массив без явной потери данных.
Я в конечном итоге должен был использовать mdadm --create --assume-clean. Я решил использовать оверлейные файлы, чтобы можно было неразрушающе тестировать различные конфигурации, пока не найду правильную.
Я использовал mdadm --examine /dev/sd*на «хороших» дисках, чтобы определить их порядок. Затем я сгенерировал возможные перестановки «плохих» дисков и пробежал по ним, пока у меня не была монтируемая файловая система. К счастью, у меня было только 24 возможных комбинации.
Я пробежал все 24 перестановки и не добился успеха. Я исследовал один из дисков Mapper ( mdadm --examine /dev/mapper/sd*), сравнил его с оригиналом и заметил, что смещение данных было другим. Я добавил data-offsetпараметр в конфигурацию, повторно протестировал перестановки и имел успех после 12-й попытки.
Вот команды, которые я выполнил во время тестирования:
Я использовал ddрезервное копирование MBR и таблицы разделов «плохих» дисков, а затем перезаписывал MBR и таблицу разделов нулями, чтобы соответствовать «хорошим» дискам, чтобы это не было проблемой при будущих перезагрузках.
После успешного восстановления я сгенерировал новый mdadm.confфайл и записал как можно больше данных о массиве на случай, если он понадобится мне в будущем. Теперь я ищу настоящее решение для резервного копирования.
... Вы также перезагрузились, чтобы подтвердить, что ваш конфиг держится?
Attie 5 лет назад
0