Очень простой вопрос, на который я нигде не смог найти четкого простого ответа!

У меня есть RAID 5 в коробке NAS с 4 физическими жесткими дисками, и два из них теперь сообщают о нескольких неисправных секторах. Я просто хочу понять, что происходит с точки зрения того, как диски связаны друг с другом, и если поврежденные данные на плохих дисках могут быть легко скопированы для других.

Этот плохой блок слепо скопирован на другие диски (я полагаю, нет)? Мое ограниченное понимание того, как данные размещаются на дисках в рейде 5, может объяснить наивность этого вопроса.

Я использую блоки QNAP NAS, и, хотя этот вопрос больше ориентирован на Linux, это общий вопрос, который я предпочел бы не отвечать только на сценарий Linux.

2 ответа2

2

Большинство систем относятся к нему так же, как к плохому сектору на устройстве без RAID.

Когда система обнаруживает неисправный сектор на любом устройстве, RAID или нет, она пытается прочитать из этого сектора и переместить данные в другой сектор. Это сделает то же самое с устройством RAID. Единственное отличие состоит в том, что гораздо более вероятно, что он сможет успешно переместить данные в другой сектор логического RAID-устройства, поскольку данные могут быть восстановлены.

Как правило, уровень RAID сообщает следующему уровню о том, что логический сектор неисправен, но он смог прочитать его содержимое. Этот следующий уровень обычно назначает новый логический сектор, записывает туда данные и соответствующим образом обновляет свою информацию отслеживания.

2

Чтобы ответить на ваш вопрос напрямую:

Этот плохой блок слепо скопирован на другие диски (я полагаю, нет)?

Это возможно, да.

Если вы выполняете операцию типа « Проверка и восстановление », то неверные данные могут считаться правильными, а устройство контроля четности обновляться ... даже если устройство контроля четности действительно корректно, и одно из другие устройства виноваты.


На этот вопрос нет простого ответа, так как здесь много переменных.

"RAID5" может звучать как стандартная вещь... но это не так. RAID5 не является стандартом между реализациями разных производителей и, возможно, даже между разными продуктами данного производителя. Тот факт, что этот термин становится все более и более популярным для простого упоминания « хранения с одним устройством контроля четности », еще больше запутывает воду. Только из-за этого нелегко дать вам ответ « он сделает это ».

При установке « аппаратного RAID » вы часто обнаруживаете, что необнаруженные ошибки чтения пропускаются через систему как успешные, даже не проверяя данные по устройству контроля четности, то есть: если сектор не определяется как плохой на устройстве хранения, то четность не помогает.

В более современных и продвинутых файловых системах, таких как ZFS и Btrfs, данные проверяются и проверяются гораздо более тщательно (данные вообще не проверялись и не проверялись ранее). Здесь ошибка чтения в режиме без вывода сообщений будет обнаружена и исправлена, даже если запоминающее устройство не смогло ее обнаружить. Кроме того, можно определить, является ли неисправным устройство контроля четности или другое устройство.

Когда запоминающее устройство знает, что чтение было плохим, тогда также есть совершенно разные возможности. На арене магнитных накопителей (Hard Disk Drive) вы обнаружите, что:

  • Настольные накопители, как правило, снова и снова пытаются выполнить успешное чтение. В течение этого времени они часто оказываются не отвечающими, и это может продолжаться в течение нескольких секунд. Это имеет смысл, поскольку такой диск предназначен для использования сам по себе, без резервирования.
  • Диски Enterprise или « NAS » будут склонны объявлять о сбоях с большей готовностью, предпочитая оставаться доступными. Опять же, это имеет смысл, потому что этот класс дисков ожидает возможность использования зеркала или устройства контроля четности для восстановления после ошибок на более высоком уровне. (Изучите Ограниченное по времени Восстановление после ошибок)

Когда речь идет о поврежденных секторах на дисках, существует два уровня, на которых можно управлять ими.

  1. Сам диск может решить, что сектор является « плохим » во время операции ввода-вывода.
  2. Файловая система может записывать сектор как « плохой » и целенаправленно избегать его.

С современными дисками № 1 это более распространено, но с более старыми дисками № 2 было то же самое - некоторые старые диски даже имели заводской список поврежденных секторов, который вам приходилось вводить при вводе в эксплуатацию.

Диски обычно не перемещают « плохие » сектора при ошибке чтения (так что вы можете повторить попытку), в то время как неудачная запись приведет к перемещению.

Чтобы погрузиться еще глубже, есть два основных режима отказа для данного сектора:

  • Данные выглядят неверно, но среда, кажется, работает нормально.
    • Ошибка чтения может быть вызвана переворачиванием битов или уменьшением сигнала из-за плохой магнитной ориентации.
    • Запись (или перезапись) будет работать нормально, и впоследствии данные будут прочитаны правильно.
  • Данные выглядят неверно, и среда не работает правильно.
    • Ошибка чтения может быть вызвана более фундаментальными проблемами с носителем данных - например, царапинами при поломке головки.
    • Запись не будет работать правильно. Обычно это приводит к перемещению сектора.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .