Ошибки SSD SMART и странные ошибки dmesg, это умирающий диск?

1281
dr Hannibal Lecter

Я начал замечать странные вещи в своем dmesgжурнале и моем 4-месячном SSD. Например:

[ 9.647535] ata7.00: exception Emask 0x10 SAct 0x7ffffbff SErr 0x300000 action 0x6 frozen [ 9.647542] ata7.00: irq_stat 0x08000000, interface fatal error [ 9.647546] ata7: SError: { Dispar BadCRC } [ 9.647551] ata7.00: failed command: READ FPDMA QUEUED [ 9.647558] ata7.00: cmd 60/b0:00:18:51:0f/03:00:07:00:00/40 tag 0 ncq 483328 in [ 9.647558] res 40/00:18:c8:5c:0f/00:00:07:00:00/40 Emask 0x10 (ATA bus error) [ 9.647561] ata7.00: status: { DRDY } [ 9.647564] ata7.00: failed command: READ FPDMA QUEUED [ 9.647570] ata7.00: cmd 60/00:08:c8:54:0f/04:00:07:00:00/40 tag 1 ncq 524288 in [ 9.647570] res 40/00:18:c8:5c:0f/00:00:07:00:00/40 Emask 0x10 (ATA bus error) [ 9.647573] ata7.00: status: { DRDY } 

Я также заметил, что мои значения SMART странные:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 16 199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 23 

Плохой блок во время выполнения кажется устойчивым, но кажется, что ошибка CRD UDMA увеличивается после каждой перезагрузки (вероятно, из-за Dispar BadCRCвышеописанного), что нехорошо ..

После онлайн-исследований я попытался заменить кабель SATA, но, похоже, это не помогло.

Когда система работает, я не могу заметить ничего особенного, кажется, что все работает, но я не могу быть уверен, так как это системный диск и не записывается так много ...

Я видел этот совет об отключении NCQ, но у меня есть два других диска, которые выигрывают от NCQ, и нет совета, как отключить его только для этого диска.

Это умирающий диск? Есть идеи, как выяснить причину?

Вот остальные странные строки dmesg: http://pastebin.com/HCxiPwkM

И вывод smartctl: http://pastebin.com/h4c4MkEb

РЕДАКТИРОВАТЬ :

Это также произошло, когда машина работала:

Jun 13 00:27:48 kernel: [21674.310312] ata7.00: exception Emask 0x10 SAct 0x400 SErr 0x100000 action 0x6 frozen Jun 13 00:27:48 kernel: [21674.310317] ata7.00: irq_stat 0x08000000, interface fatal error Jun 13 00:27:48 kernel: [21674.310320] ata7: SError: { Dispar } Jun 13 00:27:48 kernel: [21674.310323] ata7.00: failed command: READ FPDMA QUEUED Jun 13 00:27:48 kernel: [21674.310327] ata7.00: cmd 60/00:50:00:36:4f/01:00:00:00:00/40 tag 10 ncq 131072 in Jun 13 00:27:48 kernel: [21674.310327] res 40/00:50:00:36:4f/00:00:00:00:00/40 Emask 0x10 (ATA bus error) Jun 13 00:27:48 kernel: [21674.310329] ata7.00: status: { DRDY } Jun 13 00:27:48 kernel: [21674.310333] ata7: hard resetting link Jun 13 00:27:49 kernel: [21674.802471] ata7: SATA link up 6.0 Gbps (SStatus 133 SControl 330) Jun 13 00:27:49 kernel: [21674.843512] ata7.00: configured for UDMA/133 Jun 13 00:27:49 kernel: [21674.845404] ata7: EH complete 

По этой ссылке причиной может быть БП ..?

РЕДАКТИРОВАТЬ 2

Попробовал немного поменять вещи сегодня, все мои диски были на одном кабеле БП, сейчас их нет, но, похоже, это не помогает ..

Runtime_Bad_Block 18 UDMA_CRC_Error_Count 25 
3
Наиболее вероятная причина - неисправность контроллера SATA. Ну, интерфейс SATA SSD тоже может быть. Также могут быть сильные электрические помехи от других компонентов внутри ПК. Daniel B 8 лет назад 1
Мой MBO - «Asrock 770 Extreme3», я только что переместил все свои диски на внутренний контроллер SATA, мой SSD и / home диск были на контроллере Marvell 6 Гбит / с .. Я загрузился без ошибок, но они не происходят _every_ время, я должен немного подождать. Может быть, время для нового MBO и CPU, если контроллер поджарен ..: - & dr Hannibal Lecter 8 лет назад 0
Ссылка на ошибку SATA для тех, у кого возникли те же проблемы: https://lime-technology.com/wiki/index.php/The_Analysis_of_Drive_Issues dr Hannibal Lecter 8 лет назад 0

1 ответ на вопрос

0
dr Hannibal Lecter

Several days after moving all my disks to the internal SATA controller, the errors have disappeared and the SMART values have not increased.

Now it remains to be seen whether this was a specific incompatibility between my SSD and the Marvell controller, or the controller has died entirely; which is probably what's going on..but that's a topic for another day.

Похожие вопросы