1

Я не могу запустить SMART-тесты на дисках наших серверов и не могу убедиться, поддерживают ли они эту функцию или нет (CentOS 7.2).

Короткая история: у нас есть несколько идентичных серверов, которые работают в большом кластере данных. На одном из них мы получаем (примерно два раза в неделю) диски, перемонтированные только для чтения.

Я хотел запустить SMART-тесты для этих дисков, чтобы выяснить причину этой повторяющейся проблемы, но я не могу запускать SMART-тесты. Когда я хочу только информацию, это нормально:

[root@bigd08 ~]# smartctl -i /dev/sdj
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor:               HP
Product:              LOGICAL VOLUME
Revision:             4.52
User Capacity:        6,001,141,571,584 bytes [6.00 TB]
Logical block size:   512 bytes
Physical block size:  4096 bytes
Lowest aligned LBA:   0
Logical Unit id:      0x600508b1001c3738fab048c29ade60d9
Serial number:        PDNNK0BRH510G6
Device type:          disk
Local Time is:        Tue Dec 19 13:51:32 2017 EET
SMART support is:     Available - device has SMART capability.
SMART support is:     Enabled
Temperature Warning:  Disabled or Not Supported

Ну, это говорит "Включено". Если я хочу получить полную информацию:

[root@bigd08 ~]# smartctl --all -d scsi /dev/sdj -H
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Vendor:               HP
Product:              LOGICAL VOLUME
Revision:             4.52
User Capacity:        6,001,141,571,584 bytes [6.00 TB]
Logical block size:   512 bytes
Physical block size:  4096 bytes
Lowest aligned LBA:   0
Logical Unit id:      0x600508b1001c3738fab048c29ade60d9
Serial number:        PDNNK0BRH510G6
Device type:          disk
Local Time is:        Tue Dec 19 10:47:10 2017 EET
SMART support is:     Available - device has SMART capability.
SMART support is:     Enabled
Temperature Warning:  Disabled or Not Supported

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Error Counter logging not supported

Device does not support Self Test logging

или попробуйте тест:

[root@bigd08 ~]# sudo smartctl -t short /dev/sdj1
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

Short offline self test failed [unsupported scsi opcode]

Я также попытался запустить команду, выбрав scsi в качестве типа устройства и в разрешающем режиме, но вывод тот же. Однако я не пробовал другие возможные типы устройств: ata, sat [, auto] [, N] [+TYPE], usbcypress [, X], usbjmicron [, p] [, x] [, N], usbsunplus, marvell , арека, N/E, 3ware, N, hpt, L/M/N, мегарайда, N, cciss, N, авто, тест

(опция "test" говорит, что они scsi) Должен ли я попробовать их? Я попытался получить некоторые подсказки снизу:

root@bigd08 ~]# lspci -knn | grep 'RAID bus controller'
03:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)
07:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)

Нет, никаких подсказок я не получил. Я все еще хочу верить, что они поддерживают SMART. Они были куплены в начале этого года, а не 2017? Они должны иметь! Диски являются маркой HP, а также серверами и RAID-контроллерами, но производитель - Seagate (ST6000NM0024).

Я проверил руководство по продукту и увидел несколько битов, которые указывают на поддержку SMART. скриншот из руководства Seagate

https://www.seagate.com/www-content/product-content/enterprise-hdd-fam/enterprise-capacity-3-5-hdd/constellation-es-4/en-us/docs/100740544d.pdf

Я не знаю, какие биты он упоминает, хотя и как я могу проверить их из командной строки. Я предполагаю, что это биты, которые я вижу из первой команды smartctl, которую я запускаю: "Доступно", "Включено".

В Интернете много тем, которые похожи на мой случай, но большинство из них касаются USB-дисков и не учитываются.

Я ценю любую помощь, которая мне действительно нужна, чтобы получить стабильные диски. Я также принимаю ваши комментарии о том, почему они так часто становятся доступными только для чтения.

0