31

Я ищу, чтобы создать хороший маленький массив RAID для специальных резервных копий. Я хотел бы иметь около 2-4 ТБ свободного места, так как у меня есть эта неприятная небольшая привычка оцифровывать все. Таким образом, мне нужно много памяти и много избыточности на случай отказа диска. По сути, я также буду создавать резервные копии 2-3 папок /home компьютеров, используя один из клонов "Time Machine" для Linux. Этот массив будет доступен через мою локальную сеть через SSH.

У меня возникают трудности с пониманием того, как RAID-5 достигает паритета и сколько дисков на самом деле требуется. Можно предположить, что для этого нужно 5 дисков, но я могу ошибаться. Большинство диаграмм, которые я видел, только смутили меня. Похоже, что так работает RAID-5, пожалуйста, исправьте меня, так как я уверен, что не понимаю его правильно:

/---STORAGE---\    /---PARITY----\
|   DRIVE_1   |    |   DRIVE_4   |
|   DRIVE_2   |----|     ...     |
|   DRIVE_3   |    |             |
\-------------/    \-------------/

Кажется, что диски 1-3 появляются и работают как один массивный диск (capacity * number_of_drives), и диски (диски) четности выполняют резервное копирование этих дисков. Что мне кажется странным, так это то, что я обычно вижу 3+ накопителя на диаграмме и только 1 или 2 диска с четностью. Скажем, у нас 4 диска по 1 ТБ в массиве RAID-5, 3 хранилища и 1 работающая четность, у нас 3 ТБ фактической памяти, но только 1 ТБ четности !?

Я знаю, что я что-то здесь упускаю, кто-нибудь может мне помочь? Кроме того, для моего случая использования, что было бы лучше, RAID-5 или RAID-6? Отказоустойчивость является наивысшим приоритетом для меня на данный момент, так как это будет работать по сети для домашнего использования, скорость не очень критично.

5 ответов5

30

Это просто XOR каждого соответствующего бита от каждого диска - Если вы потеряете какой-либо диск, вы можете восстановить недостающие данные.

Для фона:

A B (A XOR B)
0 0    0
1 1    0
0 1    1
1 0    1

Предположим, что D - это XOR других столбцов, тогда, пока вы потеряете только один диск, вы можете выяснить, что вы потеряли.

A B C D
1 0 0 1
0 1 0 1
1 1 0 0

Иногда бит полосы будет распределен по дискам, но концепция та же самая.

Таким образом, для RAID-5, независимо от количества дисков, вам нужен только один диск для четности, равной или большей, чем самый маленький диск в массиве, который вы хотите RAID.

RAID-5 для личного использования, вероятно, лучше, так как вычислительная сложность намного ниже, чем RAID-6.

RAID-6 сложнее, используя Galois Fields для вычисления четности. И это может облагать налогом вычисления паритета. Тем не менее, вы можете потерять больше дисков, но если вы перестроите свой массив, как только вы получите один сбой, вы должны хорошо придерживаться RAID-5.

7

Вот что я считаю лучшей диаграммой, чтобы показать, как работает четность в RAID4 и RAID5

RAID4

Disk1  Disk2  Disk3  Disk4
----------------------------
data1  data1  data1  parity1
data2  data2  data2  parity2
data3  data3  data3  parity3
data4  data4  data4  parity4

RAID5

Disk1   Disk2   Disk3   Disk4
----------------------------
parity1 data1   data1   data1   
data2   parity2 data2   data2  
data3   data3   parity3 data3
data4   data4   data4   parity4
4

Я бы порекомендовал прочитать эту статью в Википедии о рейде 5 и рейде 6

http://en.wikipedia.org/wiki/Standard_RAID_levels#RAID_5_parity_handling

RAID 5 записывает блок четности в каждой полосе, поэтому для полосы A из 4-х дискового массива он записывает проверку четности на 4-м диске с данными на дисках 1, 2 и 3

Для полосы B блок контроля четности находится на диске 3 с данными на дисках 1,2 и 4 ... и т.д.

Если, скажем, диск 4 выходит из строя, данные могут быть восстановлены для полосы B, поскольку вы знаете данные на дисках 1 и 2 и можете проверить четность на диске 3.

Если полоса B имеет четность "2", а диск 1 содержит данные "1", а данные диска 2 "0", то на диске 4 должны быть данные, равные "1", поэтому диск записывается с данными = "1".

Таким образом можно воссоздать весь диск, RAID 6 расширяет его, имея 2 блока для каждой полосы.

Что касается пространства для Raid 5, вы когда-либо теряете только один диск на паритет, так как он записывает только блоки четности на полосу, тогда как в Raid 6 вы потеряете 2 диска, но также можете потерять два диска вместо того, который вы потеряете в Рейд 5;)

Статья в Википедии объясняет это лучше!

3

RAID 5 использует один диск для контроля четности, независимо от того, сколько дисков данных в массиве. Это означает, что он становится более эффективным с точки зрения используемого пространства, чем больше дисков добавляется.

Четность достигается выполнением операции XOR для одного и того же блока на каждом диске; содержимое диска контроля четности регулируется так, что все диски XOR обнуляются. Это означает, что RAID 5 ограничен наименьшей емкостью из всех дисков в массиве.

RAID 6 аналогичен, за исключением того, что два одновременных отказа диска могут быть допущены. Это полезно, потому что процесс « восстановления » массива после сбоя одного диска может быть достаточно напряженным, чтобы вызвать сбой второго диска.

0

Если ваша цель - отказоустойчивость, RAID-6 обеспечит достаточно избыточности, чтобы освободить два диска. Обычно RAID-5 допускает только один сбой диска.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .