Я понимаю, что в случае сбоя диска в конфигурации RAID, независимо от того, какой уровень RAID вы используете (1, 5, 6 или 10), вам необходимо заменить неисправный диск и восстановить массив. Теперь при использовании дисков большой емкости, предназначенных для потребителей, вероятность встретиться с URE во время восстановления достаточно высока.
Что я не понимаю, что происходит потом? Означает ли это, что весь массив немедленно становится бесполезным и нуждается в восстановлении из резервной копии (я полагаю, что после замены диска, вызывающего URE), или он все еще может работать в ухудшенном режиме (если конфигурация это позволяет)?
1 ответ
Как правило, перестройка массива прекращается, как только он попадает в URE, поэтому это вызывает беспокойство.
RAID-контроллер пытается перестроить массив так, чтобы его данные были на 100% точны до того, как понадобилось перестроение. Если он не может этого сделать (из-за URE и т.д.), То восстановление не выполняется. В этот момент вам нужно протестировать каждый диск, и если они проверят OK (и вы им доверяете), то восстановить из резервной копии.
Возьмите RAID5 для примера. Может выдержать 1 отказ диска. Итак, у вас сбой диска, и вы начинаете восстановление. Происходит URE, поэтому либо диск, с которого он читает, либо неисправный, либо контроллер думает, что это так, в этот момент диск помечается как отключенный. Таким образом, это означает, что у вас теперь два диска вышли из строя в RAID, который может обрабатывать только один диск за раз.
Возможно также проверьте этот связанный вопрос SU: почему URE терпит неудачу перестроение рейда и "делает RAID 5 непригодным для использования"