2

Если у вас есть базовый массив RAID 5 из 3 или более жестких дисков, и один из них выходит из строя, увеличивает ли это вероятность отказа одного из других дисков и делает невозможным полное восстановление? Если во время восстановления читаются все диски, повышает ли это вероятность их отказа, если они активны лишь небольшую часть дня?

Если это влияет на стабильность во время восстановления, я могу рассмотреть RAID 6. Кроме того, есть ли преимущество или недостаток использования RAID 5 вместо RAID 4? Это кажется более организованным для использования RAID 4 и более распространенным для использования RAID 5.

3 ответа3

3

Процесс восстановления RAID-массива может занять много времени (дней) и быть очень сложным для дисков. В течение этого времени восстановления оставшиеся в живых диски более подвержены сбоям из-за их активности.

Перед началом восстановления у оставшихся в живых дисков нет повышенной вероятности отказа.

По этой причине может быть нежелательно иметь "горячий" резерв в системе, так как он автоматически вызовет восстановление и вызовет сбой. Кроме того, возникновение неисправимой ошибки чтения во время перестройки может вызвать сбой массива, даже если никакие другие диски не вышли из строя. Лучше сначала скопировать данные из массива, а затем перестроить, если нет недавних резервных копий.

3

Прежде всего, если вы настроены на паритетный рейд, я бы порекомендовал RAID 5 с автоматической схемой резервного копирования поверх RAID 6. Резервное копирование может осуществляться через несколько дисков (рекомендуется), RAID 0 (не рекомендуется) или другой RAID 5. Это обеспечивает хороший баланс затрат и безопасности для ваших данных, поскольку он также может справиться со сбоями контроллера и человеческими ошибками.

Что вы будете делать безопасно, зависит от размера вашего массива

Многие в ИТ-индустрии уходят от RAID 5 по двум причинам. Во-первых, размер сдвига для многих массивов требует очень долгого времени перестройки, что открывает окно на длительное время для второго сбоя. Второй - это проблема URE, которая является неисправимой ошибкой чтения, которая не известна до тех пор, пока не удастся прочитать блок, а затем весь массив на этом диске станет нечитаемым. Опять же, URE редко встречаются с точки зрения количества сдвигов ошибок на считанные биты, но когда у вас есть массивы размера TB, редко бывает слишком часто. Массив не может быть восстановлен с диска с URE. Таким образом, если у вас есть сбой и URE, у вас фактически есть 2 неисправных диска. RAID 6 помогает в этом, потому что вы можете потерять два диска и все равно восстановить массив.

Но если у вас есть массив 100 ГБ в RAID 5, эти проблемы значительно уменьшаются, и RAID 5 становится более жизнеспособным; однако, если у вас есть массив 100 ТБ (просто в качестве примера) на рейде 6, вам может потребоваться дополнительная избыточность или другой вариант!

RAID 5 с массивами TB определенно является игрой, и я бы не стал доверять. И нет смысла запускать RAID 6 с четырьмя дисками вместо RAID 10, если вы не собираетесь в ближайшее время расширять свой массив и вам нужно делать это по одному диску за раз по цене. И давайте не будем забывать, что вы можете запускать несколько массивов RAID 1, он просто разделяет ваши данные на отдельные разделы / диски, с которыми вам нужно работать, и лишает удобства одного большого диска.

Но все имеет свои предостережения. Чем больше RAID 5, тем выше (экспоненциально выше) вероятность сбоя восстановления из-за отказа второго диска или URE. RAID 6 дороже и сложнее. RAID 10 дороже пока (но для простоты). И несколько RAID 1 для удобства.

В конце концов, вам нужно определить свои потребности, разделить то, что вы не можете потерять, и то, что вы нормально теряете. Сопоставьте это с бюджетом и уровнем знаний, выбирая, какой массив выбрать.

Мы помещаем наши офисные и домашние данные на RAID 1 (2 диска RAID 10 на самом деле с MD RAID) для обеспечения безопасности при ежедневном резервном копировании. это просто, быстро и надежно. Любые другие данные, такие как видеофайлы или другие большие некритические файлы, которые мы помещаем на RAID 5 или на отдельные диски с периодическим резервным копированием в зависимости от того, насколько важны данные, потому что мы не хотим обеспечивать такой же уровень безопасности в наших фильмах, как и наши семейные фотографии и / или файлы наших компаний.

1

Краткий ответ ДА - RAID 1+0 был разработан ОСОБЕННО из-за вероятности сбоя во время восстановления RAID5.

Длинный ответ - Да, есть повышенная вероятность отказа диска. В «наиболее очевидном / простейшем» случае можно утверждать, что выделяется больше тепла, и, таким образом, немного выше вероятность отказа. Тем не менее, это не реальный риск.

Реальный риск заключается в том, что если диски были приобретены примерно в одно и то же время, существует большая вероятность того, что диски выйдут из строя примерно в одно и то же время. Таким образом, вероятность сбоя второго диска при восстановлении увеличивается. К сожалению, этот сценарий не является академическим - чем больше диск, тем дольше перестройка и тем больше вероятность отказа. RAID5 обычно считается малоэффективным при использовании больших дисковых пулов. Принятым решением является рейд 10 (считайте RAID 1 1+0). Это в основном создает 2 идентичных набора данных в 2 наборах массивов - таким образом, он использует намного больше (почти вдвое больше) пространства, чем RAID5, но обеспечивает гораздо большую защиту от сбоя мультидиска - что, к сожалению, распространено на дисках большого размера ,

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .