Почему этот SSD возвращает противоречивые данные, почему файл образа резервной копии не совпадает с контрольной суммой?
591
basic6
Это про SSD в ноутбуке. Похоже, что SSD уже выходит из строя, возможно, даже портит данные. Кажется, он возвращает разные данные каждый раз, когда к ним обращаются, когда они не используются (подробности см. Ниже). Какие инструменты могут быть использованы для подтверждения этого подозрения?
Когда жесткий диск медленно начинает умирать, на выходе SMART обычно есть четкая индикация, графический инструмент, подобный этому gsmartcontrol, выделил бы определенное значение красным цветом, и подобный сервис, smartdвозможно, уже сгенерировал предупреждение. В этот момент у пользователя может остаться время для создания резервной копии, прежде чем диск начнет повреждать данные. Конечно, если диск уже начал повреждать данные, некоторые файлы в этой резервной копии могут быть повреждены.
Похоже, в выводе SMART нет четких предупреждений для этого SSD, ошибки ядра не были записаны в dmesg и т. Д. (С другой стороны, ecryptfs зарегистрировал ошибки). Другими словами, только случайно было обнаружено, что этот SSD уже может быть настолько плохим, что портит данные, даже когда он не используется. Сделав резервную копию (1: 1 dd-образ) этого SSD (sda), я обнаружил, что контрольная сумма файла образа не совпадает с контрольной суммой SSD. Конечно, это было в действующей системе, поэтому SSD не был смонтирован, что означает, что его содержимое не могло измениться в процессе резервного копирования.
Это то, что я сделал, чтобы сделать резервную копию. «BUTTER» - это место, где я смонтировал внешний диск, отформатированный с помощью BTRFS, чтобы я мог узнать об ошибках данных в случае, если резервный диск также неисправен (в отличие от большинства других файловых систем, BTRFS имеет контрольные суммы).
[root@localhost mnt]# time dd if=/dev/sda of=BUTTER/SSD.dd.img bs=400M && echo OK 610+1 records in 610+1 records out 256060514304 bytes (256 GB, 238 GiB) copied, 5188.27 s, 49.4 MB/s real 86m28.726s user 0m0.008s sys 7m3.597s OK
Я создал контрольную сумму MD5 для файла изображения и другой SDD, и они не совпадали. Повторив эту процедуру, я понял, что контрольная сумма MD5 SSD отличается каждый раз .
[root@localhost mnt]# time dd if=/dev/sda bs=400M | md5sum >/tmp/MD5-again 610+1 records in 610+1 records out 256060514304 bytes (256 GB, 238 GiB) copied, 1059.87 s, 242 MB/s real 17m39.904s user 8m21.708s sys 3m58.466s [root@localhost mnt]# cat /tmp/MD5-again 24e71715359158f3ab38e748af93718c - [root@localhost mnt]# time dd if=/dev/sda bs=400M | md5sum >>/tmp/MD5-again 610+1 records in 610+1 records out 256060514304 bytes (256 GB, 238 GiB) copied, 1073.7 s, 238 MB/s real 17m53.735s user 8m28.494s sys 4m23.993s [root@localhost mnt]# cat /tmp/MD5-again 24e71715359158f3ab38e748af93718c - 569d517626c1b7394acca0c4020c99bc -
Опять же, SSD никогда не был подключен ни в одной точке во время этого процесса.
# mount | grep -c sda 0
Я запустил SMART тест, который ничего не нашел. Ошибка SMART не регистрируется. УМНЫЕ атрибуты:
Сразу после публикации этого вопроса я обнаружил свою ошибку. Я использовал Fedora XFCE в качестве работающей системы, которая автоматически включала раздел подкачки, который просто находится на рассматриваемом SSD. И, конечно же, в то время как работающая система активно использовала раздел подкачки на SSD, она тем самым меняла содержимое SSD.
[root@localhost mnt]# swapon --show NAME TYPE SIZE USED PRIO /dev/sda3 partition 8G 103.3M -2
Это немного неловко сейчас, когда я уже разместил вопрос. Но я оставлю это там, надеясь, что это будет полезно для кого-то еще, кто может сделать ту же ошибку.
Все, что мне нужно было сделать, это отключить раздел подкачки, который ранее автоматически монтировался:
[root@localhost mnt]# swapoff -a
Я хотел бы отметить, что раздел подкачки был смонтирован автоматически при загрузке работающей системы. Я не хотел монтировать этот раздел подкачки. Интересно, что произойдет, если на этом разделе подкачки будет спящий образ.
После отключения ненужного раздела подкачки все заработало как положено. Используя команды, показанные выше, контрольная сумма файла изображения теперь совпадает с контрольной суммой SSD. Другими словами, этот SSD не плохой.
Спасибо за ваш комментарий, но я все еще заинтересован в исходном вопросе, предполагая, что SSD был плохим, как объяснено. Кроме того, я не рассматриваю это как чисто проблему «рекомендаций по программному обеспечению», поскольку я определенно не заинтересован в покупке программного обеспечения из-за этого. Тем не менее, кто-то может сказать: «Попробуйте это и это с Smartctl, чтобы проверить ваш диск ...»
basic6 5 лет назад
0
@ basic6 так же хорош, как этот ответ, и, конечно, образовательный, я должен согласиться с Камилем. Это не задает вопрос, который вы задали. Попробуйте отредактировать вопрос, чтобы он соответствовал этому ответу (прежде чем вы получите больше ответов), и задайте новый отдельный вопрос по исходной теме.
Tim 5 лет назад
0
Я создал [отдельный вопрос] (https://superuser.com/q/1348281/76876) на оригинальную тему.
basic6 5 лет назад
0