2

Недавно я заменил жесткий диск на резервном сервере на сайте клиента на более крупный. Это коробка freenas, работающая на HP SE326M1 *.

В то время как ZFS заменял диск, произошел серьезный сбой питания.

Не было большой проблемы - коробка запустилась снова и ресивер тоже.

Сегодня я обнаружил кое-что интересное: еще один накопитель также получил статус серебристого. Но в zpool status -v ошибок чтения / записи / cksum -v

  pool: Tank
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Sat Mar  4 15:37:53 2017
        3.41T scanned out of 4.51T at 24.7M/s, 13h3m to go
        302G resilvered, 75.43% done
config:

    NAME                                            STATE     READ WRITE CKSUM
    Tank                                            ONLINE       0     0     0
      raidz2-0                                      ONLINE       0     0     0
        gptid/ad81fb87-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/b30f664d-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/09b6b651-ff29-11e6-9a6a-d8d385e6539a  ONLINE       0     0     0  (resilvering) <-- drive was replaced
        gptid/beb62f74-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
        gptid/c2c97ff3-96b5-11e6-af9c-d8d385e6539a  ONLINE       0     0     0
      raidz2-1                                      ONLINE       0     0     0
        gptid/41b1a629-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/4756cd8e-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/508e74c7-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0
        gptid/575939b3-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0  (resilvering) <-- drive in question
        gptid/5d914967-9785-11e6-894c-d8d385e6539a  ONLINE       0     0     0

errors: No known data errors

Статус «(переадресация)» появился в последние часы - пока выполнялся перенос первого диска.

Есть ли способ определить причину, по которой второй диск тоже был изменен? Почему ZFS отображает состояние переноса на gptid/575939b3-9785-11e6-894c-d8d385e6539a независимо от ошибок, отображаемых в zpool status?

-

* HP-Server имеет рейд-контроллер P410 в режиме записи-throug. Каждый диск настроен как собственный Raid-0

1 ответ1

2

Это случилось снова, и на этот раз у меня есть журналы. оказывается, что user121391 был абсолютно прав, и на рассматриваемом диске произошла "необратимая" ошибка.

Mar 12 08:22:14 freenas ciss0: *** Fatal drive error, Port=1I Box=1 Bay=14
Mar 12 08:22:14 freenas ciss0: (da9:ciss0:0:9:0): READ(10). CDB: 28 00 1b 50 ff 98 00 00 08 00 
Mar 12 08:22:14 freenas FATAL I/O ERROR on logical drive 9 (), SCSI port 0 ID 21
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): CAM status: SCSI Status Error
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI status: Check Condition
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): SCSI sense: MEDIUM ERROR asc:11,0 (Unrecovered read error)
Mar 12 08:22:14 freenas (da9:ciss0:0:9:0): Error 5, Unretryable error

Кажется, что raid-контроллер повторно подключил диск после этой ошибки, и это вызвало повторное включение.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .