У нас есть сервер хранения 40 ТБ в RAID 5 с двенадцатью дисками по 2 ТБ. Один диск выполняет роль горячей части, и он управляется с помощью аппаратного RAID-контроллера.

По какой-то оставленной причине три диска, по-видимому, вышли из строя одновременно. Один из них, похоже, полностью потерпел неудачу, а два показывают ошибки SMART. Похоже, горячая часть не была преобразована в часть массива, но я не уверен, что это все равно произошло бы автоматически.

Вопрос в том, можно ли перезапустить эти два диска, перестроить массив, а затем сохранить эти данные до того, как эти диски в конечном итоге выйдут из строя? Мои знания об ошибке SMART состоят в том, что это не явный сбой, а просто предсказанный сбой.

Очевидно, что эти диски должны быть заменены в ближайшее время, но они полностью разорены или их можно сохранить?

2 ответа2

1

Насколько я понимаю, RAID 5 допускает 1 сбой диска в массиве. Горячая запас строится соответственно по запросу. Контроллер /GUI или любой другой интерфейс, который вы используете, используется для этого. Время, необходимое для восстановления RAID, зависит от количества используемых данных. Как только горячая резервная копия будет построена, ваш RAID теоретически вернется к нормальному состоянию. В это время отключите один из других дисков с ошибками SMART и перестройте его, используя процесс hotspare. Завершите, пока все ваши жесткие диски с ошибками не будут заменены. Я бы заменил любой диск с критическими данными на нем, показывая ошибки SMART. Вы можете использовать RAID 6 в будущем, конечно же, вам придется создавать резервные копии всех данных, перемещая их, перестраивая массив и возвращая его обратно. RAID 6 допускает больше сбоев дисков, но вы немного пострадали от скорости записи.

0

Один диск с полным отказом должен быть заменен как можно скорее, и массив может перестроиться сам. В соответствии с данным исследованием, приводы в случае сбоя SMART с большей вероятностью будут выходить из строя, чем те, на которых сбой SMART не обнаружен: https://static.googleusercontent.com/media/research.google.com/en//archive/disk_failures.pdf . Они также должны быть заменены и больше никогда не использоваться в важных случаях использования.

Предполагая, что вы используете идентичные жесткие диски, стоит получить несколько запасных частей, число которых зависит от того, как долго вы ожидаете, что устройство хранения будет оставаться в эксплуатации.

На мой взгляд, RAID5 не является хорошим вариантом для массивов дисков размером более 1 ТБ. Восстановление RAID5 занимает много времени, а при восстановлении производительность снижается. RAID5 также не очень полезен, когда у вас много (12) дисков в массиве, потому что он защищает только от одного сбоя. Второй сбой разрушает весь массив.

Для будущих сборок я рекомендую использовать RAID10, это обеспечит более стабильную высокую производительность и лучшую отказоустойчивость.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .