Если на жестком диске развивается неисправный сектор, следует ли его заменить?

6643
Nate Eldredge

Недавно я столкнулся с ошибкой ввода-вывода при чтении файла на моем жестком диске. Изучение данных SMART показывает, что на диске один неисправный сектор (счетчик Current_Pending_Sector равен 1). Файл был создан недавно (несколько часов назад), поэтому этот сбой должен быть довольно свежим.

Одним из вариантов является немедленная замена диска. Другой способ - просто восстановить нечитаемый файл из резервных копий; перезапись сектора приведет к его переназначению в другой физический сектор. Это позволило бы сэкономить на расходах и хлопотах по замене диска. Но если плохой сектор предполагает, что дальнейшая неудача может произойти в ближайшее время, то это только откладывает неизбежное.

Является ли появление одного неисправного сектора свидетельством того, что диск вышел из строя и нуждается в замене?

Другими словами, представьте, что у меня два одинаковых жестких диска. Диск А имеет 0 плохих секторов. Диск B только что разработал 1 плохой сектор. Является ли накопитель B значительно более вероятным, чем накопитель A, для дальнейшего развития плохих секторов или каким-либо другим серьезным отказом в ближайшем будущем?

Если возможно, я хотел бы видеть ответы, подкрепленные крупномасштабными данными или статистикой, а не мнением или анекдотом. Существует много лженауки и дезинформации о сбое жесткого диска, поэтому я хочу быть уверен, что мое решение будет основано на фактах.

Насколько я понимаю, «плохой сектор» означает, что определенный сектор на диске либо не может быть прочитан аппаратным способом разумным способом, либо содержит данные, которые не соответствуют контрольной сумме, хранящейся на диске. Таким образом, по какой-то причине сектор фактически больше не содержит данных, которые были первоначально там записаны. Я могу представить ряд возможных причин такой неудачи; некоторые из них предполагают, что неудача может прогрессировать, а другие нет. Может быть, космический луч перевернул несколько кусочков в этом секторе; в этом случае сбой был совершенно случайным, и нет никаких оснований полагать, что этот диск будет испытывать больше сбоев, чем новый диск. Или, может быть, крошечный червь, жующий магнитные домены на диске; он только что съел один сектор и теперь будет есть еще, так что большая потеря данных неизбежна. :-) На практике один сценарий гораздо более распространен, чем другой?

Если это уместно, речь идет о 2,5-дюймовом магнитном диске SATA емкостью 650 ГБ, который продается компанией Samsung, и ему около 5 лет. Файл с поврежденным сектором был создан менее 1 дня назад. Операционная система - Ubuntu 14.04. Все важные данные резервируются, поэтому сбой диска означает просто покупку нового диска в кратчайшие сроки, простои для замены диска и, возможно, потерю некоторых самых последних данных. Система является домашним сервером, поэтому простои неудобны, но не серьезно дорого.

4
Извините - не прочитал весь пост, но я видел жесткие диски, которые работают нормально с ~ 15% плохих секторов. Если он только один - забудь об этом. Предотвратить ротационный жесткий диск от плохих секторов довольно сложно. Жесткие диски имеют собственное (аппаратное решение) решение для поврежденных секторов, но если их будет слишком много, произойдет сбой. Вы можете сканировать весь диск с помощью некоторого программного обеспечения. Ifch0o1 8 лет назад 0
В этой ситуации вы можете рассмотреть возможность использования зеркала mdadm RAID1 или ZFS с жесткими дисками A и B, пока оба диска по-прежнему могут использоваться. Таким образом, когда один из них потерпит неудачу, это не будет таким неудобным. Обязательно выполняйте регулярные операции очистки массива, чтобы, когда диск сообщал об ошибке чтения, контроллер raid мог сообщить диску, какие данные он должен иметь в этом блоке, и жесткий диск может при необходимости переназначить блок. Вы также можете проверить hdd исследование по умной статистике на https://www.backblaze.com/blog/hard-drive-smart-stats/ BeowulfNode42 7 лет назад 0
@ BeowulfNode42: К сожалению, у этой машины только один отсек для дисков, и нет простого способа подключения внешних SATA. Nate Eldredge 7 лет назад 0

4 ответа на вопрос

5
DustinRS

With a single bad sector and considering the drive's age, I would be concerned; however, you say it won't be a big deal if it crashes and you are following a good backup strategy, so I feel like you are fine waiting for it to do its thing.

That may happen tomorrow or it may happen in 10 years. It may happen after developing more bad sectors or it may never happen. You mention cosmic rays--that's exactly the thing--it could have been anything that made the one sector go bad. Let the hard-drive and OS mark the sector as bad and keep on doing what you've been doing as far as backups. When you have the time and resources to replace the drive, do it, but I wouldn't worry about making it a priority.

3
Rahul Dahiya

I have faced this situation.In case of bad sectors after sometime you won't be able to copy data back from the disk which has bad sector.After sometime you will start facing slow down issues which will ultimately lead to crashing of the operating system.
In short just replace the drive and don't risk your data.

Это на самом деле не отвечает на мой вопрос. Я хорошо знаю последствия плохих секторов - чтение файла приводит к задержке, пока файл перечитывается, и в конечном итоге к ошибкам ввода-вывода. Нынешняя ошибка легко исправляется путем переписывания файла, как я уже упоминал. Я понимаю, что дальнейшие ошибки будут проблемой - я хочу знать, насколько вероятно, что они действительно произойдут. Я готов принять определенный уровень риска, поскольку, как уже упоминалось, у меня есть резервные копии, но я хочу количественно оценить риск, который я на самом деле беру на себя. Nate Eldredge 8 лет назад 0
Так как плохие сектора являются признаком выхода из строя вашего жесткого диска, они будут продолжать расти (я пытался использовать мой как внешний после замены, но с треском провалился). Rahul Dahiya 8 лет назад 0
«Я хочу знать, насколько вероятно, что они действительно произойдут». - Скорее всего. Это может быть через день или через год. Жесткий диск имеет только определенное количество резервных секторов, когда они закончатся, вы начнете навсегда терять данные. Ramhound 8 лет назад 0
На самом деле это зависит от использования жесткого диска, если вы продолжаете использовать жесткий диск интенсивно (что я делал, я продолжал переустанавливать Windows всякий раз, когда он не загружается, и это не занимало более месяца), я не думаю, Это займет больше месяца. Проблема с файловой системой Windows заключается в том, что она не хранит данные непрерывно, поэтому, скажем, если у вас есть плохой сектор в определенном месте, окна будут сталкиваться с ним снова и снова, когда вы продолжаете писать и читать данные с жесткого диска, что приведет к замедлению и, наконец, сбой. Rahul Dahiya 8 лет назад 0
1
BillDOe

I would suggest keeping an eye on the bad sector count. If it remains the same for an extended period, say a month, then you're fine; the defect was probably a manufacturing issue or some other random event. However, if your bad sector count continues to grow, you definitely have problems and need to replace the drive.

Edit: Updating my answer to say that the questionable drive should be checked daily. If after a month there are no new bad sectors, then the drive is almost certainly fine, but if you see new ones every day, then the drive needs to be replaced ASAP. You also need to make sure the drive or computer is on a solid surface that isn't easily jostled.

Это разумный совет (и не должен был быть опущен IMO), если вы не параноик. Если это внешний накопитель или ноутбук, то это скорее всего будет производственный дефект и, возможно, результат удара / вибрации. sawdust 8 лет назад 0
1
Journeyman Geek

Eventually

However drives are designed to be resilient to bad sectors, and many drives keep running for a while with bad sectors. Your drive has spare sectors to handle these as they come along, and you need to look at the big picture when deciding to replace your drive.

I'm guessing you're looking at smart data and syslog. There's specific errors in the latter - that would indicate what exactly is wrong and would be helpful here. Look for drive related correctable errors (which are slightly scary but not so much) and uncorrectable ones (which are a sign of impending doom). I can't remember the errors off the top of my head.

The fact that its a pending sector count is worrying. The sector should be replaced posthaste. I'd also look at "Uncorrectable Sector Count"and anything else that's pink here on the wikipedia page on smart attributes. There's also a smart attribute that shows the grown number of bad sectors. Lower the better there, but its a sign of gradual failure rather than dropping dead.

There's a few danger signs here

  1. Sectors arn't being replaced yet. Granted its a VERY low number and you should be alright for a while

  2. The drive is 5 years old. Its on the tailend of a longer warranty cycle/typical computer design life cycle.

There's a few things that are reassuring. You know the drive might die at any time and have backed up and are prepared for data loss. I wouldn't say run out and buy a drive now, but it would be prudent to plan for a replacement drive soon. You can always use the old drive for transient data till it dies.