Сбой nvm, ошибка ввода-вывода, не обнаружен в BIOS

362
Thomas Leclercq

У меня повторяющаяся проблема в течение месяца или около того с моим (одним) SSD, подключенным к порту nvm.

Конфигурация:

OS: Archlinux Laptop Razer Blade Stealth 2017 SSD: `Samsung NVMe SSD Controller SM951/PM951` 

Когда проблема начинается (внезапно, это может произойти после 10 секунд загрузки или 2 часов), все мои процессы начинают отказывать из-за Input/Output error. Когда-то перед ошибкой ввода-вывода я получаю некоторые Read-only filesystemошибки.

Иногда я перезагружаю ноутбук, и он больше не обнаруживает мое устройство! (загружается непосредственно в BIOS, потому что ... нет устройств, а затем, если я иду в раздел BIOS nvm, он говорит, что ничего не обнаружено ...)

Явно поврежденный SSD здесь! Я запускаю основной fsckи badblocks, оба говорят мне, что все в порядке. Я очистил все устройство с нулевыми нитями и снова установил свою ОС, проблема все еще остается.

это вывод из smartctl --all /dev/nvme0n1

=== START OF INFORMATION SECTION === Model Number: SAMSUNG MZVLV512HCJH-00000 Serial Number: S2J6NX0H906873 Firmware Version: BXV7000Q PCI Vendor/Subsystem ID: 0x144d IEEE OUI Identifier: 0x002538 Controller ID: 1 Number of Namespaces: 1 Namespace 1 Size/Capacity: 512,110,190,592 [512 GB] Namespace 1 Utilization: 511,650,234,368 [511 GB] Namespace 1 Formatted LBA Size: 512 Local Time is: Wed Sep 12 21:59:29 2018 IST Firmware Updates (0x06): 3 Slots Optional Admin Commands (0x0007): Security Format Frmw_DL Optional NVM Commands (0x001f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Maximum Data Transfer Size: 32 Pages  Supported Power States St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat 0 + 6.00W - - 0 0 0 0 5 5 1 + 4.20W - - 1 1 1 1 30 30 2 + 3.10W - - 2 2 2 2 100 100 3 - 0.0700W - - 3 3 3 3 500 5000 4 - 0.0050W - - 4 4 4 4 2000 22000  Supported LBA Sizes (NSID 0x1) Id Fmt Data Metadt Rel_Perf 0 + 512 0 0  === START OF SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED  SMART/Health Information (NVMe Log 0x02, NSID 0x1) Critical Warning: 0x00 Temperature: 37 Celsius Available Spare: 100% Available Spare Threshold: 10% Percentage Used: 1% Data Units Read: 10,189,885 [5.21 TB] Data Units Written: 14,400,717 [7.37 TB] Host Read Commands: 145,666,903 Host Write Commands: 268,275,465 Controller Busy Time: 1,937 Power Cycles: 2,475 Power On Hours: 3,256 Unsafe Shutdowns: 438 Media and Data Integrity Errors: 0 Error Information Log Entries: 1,985  Error Information (NVMe Log 0x01, max 64 entries) Num ErrCount SQId CmdId Status PELoc LBA NSID VS 0 1985 0 0x0018 0x4004 0x000 0 0 - 1 1984 0 0x0012 0x4004 0x000 0 0 - 2 1983 0 0x0007 0x4004 0x000 0 0 - 3 1982 0 0x0006 0x4004 0x000 0 0 - 4 1981 0 0x0005 0x4004 0x000 0 0 - 5 1980 0 0x0009 0x4004 0x000 0 0 - 6 1979 0 0x0009 0x4004 0x000 0 0 - 7 1978 0 0x0003 0x4004 0x000 0 0 - 8 1977 0 0x0004 0x4004 0x000 0 0 - 9 1976 0 0x0007 0x4004 0x000 0 0 - 10 1975 0 0x000b 0x4004 0x000 0 0 - 11 1974 0 0x0001 0x4004 0x000 0 0 - 12 1973 0 0x0012 0x4004 0x000 0 0 - 13 1972 0 0x001c 0x4004 0x000 0 0 - 14 1971 0 0x0000 0x4004 0x000 0 0 - 15 1970 0 0x0012 0x4004 0x000 0 0 - ... (48 entries not shown) 

Я пытался, smartctl -t short /dev/nvme0n1но, к сожалению, это не похоже на работу.

Может кто-то указать мне верное направление? Я не против поменять свой SSD, но я боюсь, что это может быть неисправный контроллер, и тогда мне придется заменить материнскую плату (или ноутбук)

0

0 ответов на вопрос

Похожие вопросы