Возможно, один из ваших дисков был отключен, а затем снова подключен, но обнаружен как новое устройство. В моем опыте работы с серверами Linux это иногда случается, если старое устройство не отключилось должным образом, а ядро все еще держит свою букву, и при повторном подключении оно выдаст ему новую букву. Возможно, один из ваших дисков неисправен или кабели не закреплены. Это действительно зависит от контроллера и от того, как он работает с устройствами.
Поскольку вы говорите, что обнаружили, что машина уже зависла, и вы не можете по-настоящему осмотреть ее, чтобы посмотреть, что произошло, я бы предложил написать небольшой скрипт bash, постоянно извлекающий информацию обо всех дисках и записывающий ее в файл, предпочтительно на один из дисков. Вы уверены, что работаете, иначе он может не записаться, если вы попытаетесь записать его на неисправный диск. Сценарий может быть что-то вроде:
#!/bin/bash date echo "Starting device data dump" for drive in sda sdb sdc sdd do echo "Dumping data for drive $" fdisk -l smartctl -a /dev/$ dmesg -T | tail -n50 done echo "Ended device data dump"
Поместите это в cron, работающий каждую минуту и записывающий вывод в файл с
crontab -e
Crontab строка для добавления:
* * * * * /usr/local/bin/logcommand.sh >> /var/log/disk-problem.log
После руки проверьте, что в файле. Вы сможете увидеть смарт-данные sdd, такие как модель, марка, серийный номер и сравнить их с другими вашими дисками. Если один из них отключится, будет совпадение, если нет, вы все равно сможете получить информацию об этом загадочном жестком диске и о том, что это может быть.
Также проверьте, записан ли ваш dmesg в какой-либо файл в / var / log. dmesg должен распечатать устройство отключений и обнаружений.
PS: Кроме того, поскольку ваша машина зависает, когда вы ее находите, вероятно, это ваше корневое устройство, которое избавляет вас от проблем, поскольку, если она удерживает базовую систему, и без нее машина не сможет функционировать.