Сбой сменного диска во время восстановления NFS на nas4free

356
Gary Crockett

Я бегу nas4free v. 10.3.0.3., Используя ZFS, с четырьмя 2TB накопителями RaidZ1. Раз в год я делаю полное резервное копирование, отключаю самый старый диск от сети, заменяю его новым и запускаю команду «zpool replace mytank / dev / ada0», и он автоматически запускает функцию восстановления.

В эти выходные я начал процесс, как всегда. В то время время до завершения составляло около 8 часов. Тем не менее, теперь, после более чем 24 часов, восстановление еще не завершено. Глядя на экран «Диски | ZFS | Пулы | Информация», кажется, что процесс восстановления продолжается. Прямо сейчас, его 0,14% сделано. Я знаю, что это было на этом этапе несколько раз раньше.

Таким образом, зная, что повторное копирование создает нагрузку на накопители, я запускал smartctl для каждого отдельного накопителя. Три "старых" диска не показывают ошибок вообще. Все "нормально".

Тем не менее, «новый» диск не. Вот несколько важных строк из вывода smartctl:

=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: FAILED! Drive failure expected in less than 24 hours. SAVE ALL DATA. ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 5 Reallocated_Sector_Ct 0x0033 001 001 005 Pre-fail Always FAILING_NOW 0 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0 197 Current_Pending_Sector 0x0022 001 001 000 Old_age Always - 2000  SMART Error Log Version: 1 ATA Error Count: 270 (device log contains only the most recent five errors) 

Да, я думаю, что диск не работает.

Теперь мои вопросы:

1) Как отключить плохой диск? Так же, как я всегда делаю?

2) Остановит ли поврежденный диск "офлайн" процесс восстановления?

3) После замены испорченного диска и выдачи zpool replaceкоманды автоматическое включение автозагрузчика снова?

Спасибо за вашу помощь.

0

1 ответ на вопрос

0
a CVn
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 5 Reallocated_Sector_Ct 0x0033 001 001 005 Pre-fail Always FAILING_NOW 0 197 Current_Pending_Sector 0x0022 001 001 000 Old_age Always - 2000 

Похоже, у меня есть лимон. Такие вещи случаются; RMA диск и получить замену. С недавней покупкой, предположительно низким количеством часов при включении питания и отказами, указанными SMART, это не должно быть проблемой. Если посредник суетится по этому поводу, найдите другого посредника и вместо этого начните делать покупки там.

1) Как отключить плохой диск? Так же, как я всегда делаю?

Вы всегда можете отключить диск с помощью zpool offline <pool> <dev>. Просто будьте осторожны, чтобы держаться выше порога избыточности пула. (Я не думаю, что ZFS позволит вам удалить диск, который приведет к тому, что пул будет ниже порогового значения резервирования без принуждения, и тогда он может даже не сделать этого, но легко попасть в ловушку добавления -fбез продумывания последствия.)

2) Остановит ли поврежденный диск "офлайн" процесс восстановления?

Так и должно быть, так как теперь нет необходимости в перевоспитании. Однако помните, что у вас не будет никакой избыточности, поэтому любые сбои (даже ошибки ввода-вывода на уровне сектора), пока пул находится в этой конфигурации, потенциально критически важны.

3) После замены поврежденного диска и выполнения команды zpool replace, будет ли запускать автоматическое повторное включение автоматически?

Возможно, вам понадобится zpool onlineновый диск, так как старый был взят offline, но я так не думаю. Концептуально, zpool replace <pool> <old> <new>это то же самое, что zpool attach <pool> <new>следует zpool detach <pool> <old>(но вы не можете подключать / отключать устройства в raidz vdev).

Что касается ZFS, новый заменяющий диск будет нуждаться в восстановителе, так что запуск будет возобновлен.

Тем не менее, эта часть вашего вопроса выделилась мне:

четыре 2ТБ диска RaidZ1. Раз в год я делаю полное резервное копирование, отключаю самый старый диск от сети, заменяю его новым и запускаю команду «zpool replace mytank / dev / ada0»,

Я бы посоветовал вам не удалять старый диск перед установкой нового, особенно если он работает сносно. (У меня был диск, из-за которого возникали ошибки из-за одной лишь мысли о вводе-выводе на него, и в этом случае отключение или удаление поврежденного диска может быть разумным выбором.) Вместо этого подключите новый диск вместе с старый, а zpool replace <pool> <old> <new>. Делая это, вы получаете выгоду от избыточности, которую вы имеете в пуле; затем, если какой-либо из других дисков столкнется с проблемой во время восстановления, вероятность того, что система сможет справиться с этим изящно и без потери данных, значительно выше.

По очень мере, запустить zpool scrubдо завершения на бассейн непосредственно перед offlining диска вы заменяющий.