Я не могу запустить SMART-тесты на дисках наших серверов и не могу убедиться, поддерживают ли они эту функцию или нет (CentOS 7.2).
Короткая история: у нас есть несколько идентичных серверов, которые работают в большом кластере данных. На одном из них мы получаем (примерно два раза в неделю) диски, перемонтированные только для чтения.
Я хотел запустить SMART-тесты для этих дисков, чтобы выяснить причину этой повторяющейся проблемы, но я не могу запускать SMART-тесты. Когда я хочу только информацию, это нормально:
[root@bigd08 ~]# smartctl -i /dev/sdj
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 4.52
User Capacity: 6,001,141,571,584 bytes [6.00 TB]
Logical block size: 512 bytes
Physical block size: 4096 bytes
Lowest aligned LBA: 0
Logical Unit id: 0x600508b1001c3738fab048c29ade60d9
Serial number: PDNNK0BRH510G6
Device type: disk
Local Time is: Tue Dec 19 13:51:32 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Disabled or Not Supported
Ну, это говорит "Включено". Если я хочу получить полную информацию:
[root@bigd08 ~]# smartctl --all -d scsi /dev/sdj -H
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 4.52
User Capacity: 6,001,141,571,584 bytes [6.00 TB]
Logical block size: 512 bytes
Physical block size: 4096 bytes
Lowest aligned LBA: 0
Logical Unit id: 0x600508b1001c3738fab048c29ade60d9
Serial number: PDNNK0BRH510G6
Device type: disk
Local Time is: Tue Dec 19 10:47:10 2017 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Disabled or Not Supported
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
Error Counter logging not supported
Device does not support Self Test logging
или попробуйте тест:
[root@bigd08 ~]# sudo smartctl -t short /dev/sdj1
smartctl 6.2 2017-02-27 r4394 [x86_64-linux-3.10.0-327.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
Short offline self test failed [unsupported scsi opcode]
Я также попытался запустить команду, выбрав scsi в качестве типа устройства и в разрешающем режиме, но вывод тот же. Однако я не пробовал другие возможные типы устройств: ata, sat [, auto] [, N] [+TYPE], usbcypress [, X], usbjmicron [, p] [, x] [, N], usbsunplus, marvell , арека, N/E, 3ware, N, hpt, L/M/N, мегарайда, N, cciss, N, авто, тест
(опция "test" говорит, что они scsi) Должен ли я попробовать их? Я попытался получить некоторые подсказки снизу:
root@bigd08 ~]# lspci -knn | grep 'RAID bus controller'
03:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)
07:00.0 RAID bus controller [0104]: Hewlett-Packard Company Smart Array Gen9 Controllers [103c:3239] (rev 01)
Нет, никаких подсказок я не получил. Я все еще хочу верить, что они поддерживают SMART. Они были куплены в начале этого года, а не 2017? Они должны иметь! Диски являются маркой HP, а также серверами и RAID-контроллерами, но производитель - Seagate (ST6000NM0024).
Я проверил руководство по продукту и увидел несколько битов, которые указывают на поддержку SMART. скриншот из руководства Seagate
Я не знаю, какие биты он упоминает, хотя и как я могу проверить их из командной строки. Я предполагаю, что это биты, которые я вижу из первой команды smartctl, которую я запускаю: "Доступно", "Включено".
В Интернете много тем, которые похожи на мой случай, но большинство из них касаются USB-дисков и не учитываются.
Я ценю любую помощь, которая мне действительно нужна, чтобы получить стабильные диски. Я также принимаю ваши комментарии о том, почему они так часто становятся доступными только для чтения.