5

Мы часто видим советы по смешиванию модели или бренда жесткого диска для RAID-массивов (также работает для любых групп дисков, например, для пула ZFS).
Обоснование таково: накопители, произведенные в одной партии, имеют тенденцию иметь одинаковые внутренние проблемы, поэтому имеют тенденцию выходить из строя вместе.

Я использую идентичные диски для RAID с более 60 лет. Я никогда не замечал никаких проблем.
Но другие люди делают.
Точка зрения, статистика, совпадение, удача, судьба ... или реальная опасность?

Есть ли (серьезное) исследование или источник о сопряжении дисков в RAID?

Единственный хороший аргумент, который я знаю до сих пор, касается прошивок: когда диск зависает из-за ошибки прошивки, близнец, скорее всего, выйдет из строя в течение узкого промежутка времени. Но также похожий диск из другой партии. Это редкое событие, но мы говорим о небольших улучшениях между двумя методами, поэтому в балансе учитываются редкие события.

2 ответа2

7

Я никогда не видел исследования по RAID-массивам, но то, что вы имеете в виду, называется Common Mode Failure в научном сообществе, и существует множество исследований по этому вопросу. Google твой друг.

Как ни странно, как и вы, я построил массивы RAID (5/6) на многих системах в течение многих лет, и из полдюжины или около того систем, которые я создавал с одинаковыми дисками, из тех, у которых были сбои, у всех этих наборов было несколько Отказы дисков в течение нескольких месяцев друг от друга. У меня был один массив несколько лет назад с 8 одинаковыми дисками 9G, и 6 из них вышли из строя в течение 6 месяцев после работы в течение более 3 лет. Это определенно укрепило мое мнение о некоторых производителях дисков. С другой стороны, из массивов, у которых не было сбоев, они по-прежнему работают просто отлично, один работает 10 лет с (корпоративными) накопителями, на которые предоставляется 3-летняя гарантия.

Но Отказ общего режима здесь все еще применяется. Я стараюсь смешивать и подбирать производителей на однотипных (корпоративных) дисках, чтобы полностью избежать этой проблемы. (Я также переключился на ZFS, чтобы преодолеть дыру в RAID5, но это уже другая тема).

4

Я знаю 2 статьи о жестких дисках и / или RAID:

Использование разнообразия устройств для защиты данных от сбоев дисков, связанных с пакетной обработкой
Этот основан на сбое пакета, но не обсуждается частота возникновения такой проблемы.

Отказы дисков в реальном мире. Что означает для вас MTTF в 1 000 000 часов?
Этот основан на исследовании против 100 000 дисков, и там немного говорится о партиях.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .