У меня повторяющаяся проблема в течение месяца или около того с моим (одним) SSD, подключенным к порту nvm.

Конфигурация:

OS: Archlinux
Laptop Razer Blade Stealth 2017
SSD: `Samsung NVMe SSD Controller SM951/PM951`

Когда проблема начинается (внезапно, это может произойти через 10 секунд загрузки или через 2 часа), весь мой процесс запускается с ошибкой из-за Input/Output error . Незадолго до ошибки ввода-вывода я получаю некоторые ошибки Read-only filesystem .

Иногда я перезагружаю ноутбук, и он больше не обнаруживает мое устройство! (загружается непосредственно в BIOS, потому что ... нет устройств, а затем, если я иду в раздел BIOS nvm, он говорит, что ничего не обнаружено ...)

Явно поврежденный SSD здесь! Я запускаю основной fsck и badblocks , оба говорят мне, что все в порядке. Я очистил все устройство с нулевыми нитями и снова установил свою ОС, проблема все еще остается.

это вывод из smartctl --all /dev/nvme0n1

=== START OF INFORMATION SECTION ===
Model Number:                       SAMSUNG MZVLV512HCJH-00000
Serial Number:                      S2J6NX0H906873
Firmware Version:                   BXV7000Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Controller ID:                      1
Number of Namespaces:               1
Namespace 1 Size/Capacity:          512,110,190,592 [512 GB]
Namespace 1 Utilization:            511,650,234,368 [511 GB]
Namespace 1 Formatted LBA Size:     512
Local Time is:                      Wed Sep 12 21:59:29 2018 IST
Firmware Updates (0x06):            3 Slots
Optional Admin Commands (0x0007):   Security Format Frmw_DL
Optional NVM Commands (0x001f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size:         32 Pages

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     6.00W       -        -    0  0  0  0        5       5
 1 +     4.20W       -        -    1  1  1  1       30      30
 2 +     3.10W       -        -    2  2  2  2      100     100
 3 -   0.0700W       -        -    3  3  3  3      500    5000
 4 -   0.0050W       -        -    4  4  4  4     2000   22000

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02, NSID 0x1)
Critical Warning:                   0x00
Temperature:                        37 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    1%
Data Units Read:                    10,189,885 [5.21 TB]
Data Units Written:                 14,400,717 [7.37 TB]
Host Read Commands:                 145,666,903
Host Write Commands:                268,275,465
Controller Busy Time:               1,937
Power Cycles:                       2,475
Power On Hours:                     3,256
Unsafe Shutdowns:                   438
Media and Data Integrity Errors:    0
Error Information Log Entries:      1,985

Error Information (NVMe Log 0x01, max 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0       1985     0  0x0018  0x4004  0x000            0     0     -
  1       1984     0  0x0012  0x4004  0x000            0     0     -
  2       1983     0  0x0007  0x4004  0x000            0     0     -
  3       1982     0  0x0006  0x4004  0x000            0     0     -
  4       1981     0  0x0005  0x4004  0x000            0     0     -
  5       1980     0  0x0009  0x4004  0x000            0     0     -
  6       1979     0  0x0009  0x4004  0x000            0     0     -
  7       1978     0  0x0003  0x4004  0x000            0     0     -
  8       1977     0  0x0004  0x4004  0x000            0     0     -
  9       1976     0  0x0007  0x4004  0x000            0     0     -
 10       1975     0  0x000b  0x4004  0x000            0     0     -
 11       1974     0  0x0001  0x4004  0x000            0     0     -
 12       1973     0  0x0012  0x4004  0x000            0     0     -
 13       1972     0  0x001c  0x4004  0x000            0     0     -
 14       1971     0  0x0000  0x4004  0x000            0     0     -
 15       1970     0  0x0012  0x4004  0x000            0     0     -
... (48 entries not shown)

Я попробовал smartctl -t short /dev/nvme0n1 но, к сожалению, он не работает.

Может кто-то указать мне верное направление? Я не против поменять свой SSD, но я боюсь, что это может быть неисправный контроллер, и тогда мне придется заменить материнскую плату (или ноутбук)

0