Я бегу nas4free v. 10.3.0.3., Используя ZFS, с четырьмя 2TB накопителями RaidZ1. Раз в год я делаю полное резервное копирование, отключаю самый старый диск от сети, заменяю его новым и запускаю команду «zpool replace mytank /dev /ada0», и он автоматически запускает функцию восстановления.

В эти выходные я начал процесс, как всегда. В то время время до завершения составляло около 8 часов. Тем не менее, теперь, после более чем 24 часов, восстановление еще не завершено. Глядя на экран «Диски | ZFS | Пулы | Информация», кажется, что процесс восстановления продолжается. Прямо сейчас, его 0,14% сделано. Я знаю, что это было на этом этапе несколько раз раньше.

Таким образом, зная, что повторное копирование создает нагрузку на диски, я запускал smartctl на каждом отдельном диске. Три "старых" диска не показывают ошибок вообще. Все "нормально".

Тем не менее, "новый" диск не. Вот несколько важных строк из вывода smartctl:

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: FAILED!
Drive failure expected in less than 24 hours. SAVE ALL DATA.
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   001   001   005    Pre-fail  Always   FAILING_NOW 0
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   001   001   000    Old_age   Always       -       2000

SMART Error Log Version: 1
ATA Error Count: 270 (device log contains only the most recent five errors)

Да, я думаю, что диск не работает.

Теперь мои вопросы:

1) Как отключить плохой диск? Так же, как я всегда делаю?

2) Остановит ли поврежденный диск "офлайн" процесс восстановления?

3) После замены поврежденного диска и выдачи команды zpool replace , будет ли запускать автоматическое повторное включение автоматически?

Спасибо за вашу помощь.

1 ответ1

0
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   001   001   005    Pre-fail  Always   FAILING_NOW 0
197 Current_Pending_Sector  0x0022   001   001   000    Old_age   Always       -       2000

Похоже, у меня есть лимон. Такие вещи случаются; RMA диск и получить замену. С недавней покупкой, предположительно низким количеством часов при включении питания и отказами, указанными SMART, это не должно быть проблемой. Если посредник суетится по этому поводу, найдите другого посредника и вместо этого начните делать покупки там.

1) Как отключить плохой диск? Так же, как я всегда делаю?

Вы всегда можете отключить диск с помощью zpool offline <pool> <dev> . Просто будьте осторожны, чтобы держаться выше порога избыточности пула. (Я не думаю, что ZFS позволит вам удалить диск, который приведет к тому, что пул опустит порог избыточности без принуждения, и тогда он может даже не сделать этого, но легко попасть в ловушку добавления -f без продумывая последствия.)

2) Остановит ли поврежденный диск "офлайн" процесс восстановления?

Так и должно быть, так как теперь нет необходимости в перевоспитании. Однако помните, что у вас не будет никакой избыточности, поэтому любые сбои (даже ошибки ввода-вывода на уровне сектора), пока пул находится в этой конфигурации, потенциально критически важны.

3) После замены поврежденного диска и выдачи команды zpool replace, будет ли запускать автоматическое повторное включение автоматически?

Возможно, вам понадобится zpool online новый диск онлайн, так как старый был offline , но я так не думаю. Концептуально zpool replace <pool> <old> <new> - это то же самое, что zpool attach <pool> <new> за которым следует zpool detach <pool> <old> (но вы не можете подключать / отключать устройства в raidz vdev).

Что касается ZFS, новый заменяющий диск будет нуждаться в восстановителе, так что запуск будет возобновлен.

Тем не менее, эта часть вашего вопроса выделилась мне:

четыре 2ТБ диска RaidZ1. Раз в год я делаю полное резервное копирование, отключаю самый старый диск от сети, заменяю его новым и запускаю команду «zpool replace mytank /dev /ada0»,

Я бы посоветовал вам не удалять старый диск перед установкой нового, особенно если он работает сносно. (У меня был диск, извергавший ошибки из-за одной лишь мысли о вводе-выводе на него, и в таком случае отключение или удаление поврежденного диска может быть разумным выбором.) Вместо этого подключите новый диск вместе со старым, и zpool replace <pool> <old> <new> . Делая это, вы получаете выгоду от избыточности, которую вы имеете в пуле; затем, если какой-либо из других дисков столкнется с проблемой во время восстановления, вероятность того, что система сможет справиться с этим изящно и без потери данных, значительно выше.

По крайней мере, запустить zpool scrub для завершения на бассейн непосредственно перед offlining диска вы заменяющий.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .