В настоящее время у меня есть накопитель емкостью 1 ТБ, 2 ТБ и 3 ТБ, вероятно, используется около 5,5 ТБ, и я думаю, что куплю еще два 4-ТБ диска и настрою массив RAID 4 ТБ x 4 ТБ x 3 ТБ.
При использовании дисков объемом 4 ТБ вам не нужно смотреть на RAIDZ с одним резервированием. Я бы порекомендовал RAIDZ2 из-за дополнительной защиты, которую он предоставляет в случае, если один диск каким-то образом сломается или возникнет проблема.
Помните, что потребительские диски обычно рассчитаны на скорость URE, равную одному отказавшему сектору на 10 ^ 14 бит чтения. 1 ТБ (терабайт производителя жесткого диска) составляет 10 ^ 12 байтов или близко к 10 ^ 13 битам, дает или принимает небольшое количество изменений. Пройденный полный цикл чтения массива, который вы имеете в виду, статистически может столкнуться с проблемой, и на практике проблемы чтения, как правило, возникают в пакетном режиме.
Я не уверен, почему вы предлагаете RAIDZ2. Более вероятно, что у меня разовьются два отказа дисковода, если я использую RAIDZ1, чем если бы я не использовал RAID? Я хочу улучшить отказоустойчивость моей системы. Ничего не восстанавливаемого не будет существовать только в одном месте, поэтому RAID-массив - это просто вопрос удобства.
RAIDZ1 использует один диск для обеспечения избыточности в vdev, тогда как RAIDZ2 использует два (и некоторые более сложные вычисления, но в любом случае вы вряд ли будете ограничены пропускной способностью вычислений RAIDZ). Преимущество второго резервного диска в том случае, если первый отказывает или становится недоступным по иным причинам. Из-за избыточности только одного диска любые дополнительные ошибки становятся критическими. При 4+4+3 ТБ у вас есть 11 ТБ необработанного хранилища, первоначально 6 ТБ из которых, возможно, потребуется прочитать для восстановления потерянного диска (8 ТБ после обновления диска 3 ТБ до 4 ТБ и расширения пула чтобы соответствовать). Для оценок по порядку величины это хорошо округляется где-то между 10 ^ 13 и 10 ^ 14 битами. Статистически, у вас есть что-то вроде 50% -100% вероятности попадания в неисправимую ошибку чтения во время повторного переноса при использовании единственной избыточности с массивом такого размера. Конечно, вам может очень повезло, но это внезапно означает, что у вас нет никакой защиты в случае отказа диска.
Насколько я понимаю, для таких неоднородных дисковых массивов размер пула будет ограничен размером самого маленького диска, что означало бы, что я бы посмотрел на RAIDZ-массив 3 x 3 x 3 ТБ с 6 ТБ полезного пространства и 2 ТБ не отказоустойчивое пространство - это правда?
Почти. ZFS ограничит размер vdev размером наименьшего составляющего устройства, поэтому вы получите эффективную емкость RAIDZ-устройства vdev из трех устройств, состоящего из 3 ТБ устройств, то есть 6 ТБ доступного для пользователя хранилища (метаданные предоставления или получения). Оставшиеся 2 ТБ необработанного хранилища тратятся впустую; он не доступен для использования даже без резервирования. (Они будут отображаться в столбце EXPANDSZ
в zpool list
, но они не используются.)
После того, как вы замените диск объемом 3 ТБ на диск объемом 4 ТБ и развернете vdev (обе из которых являются оперативными операциями в ZFS), пул сможет использовать дополнительное пространство для хранения.
Есть пути вокруг этого - например, можно разделить диски представить три 3 устройство ТБА и два 1 ТБ (остаток от двух 4 дисков ТБА) устройства для ZFS - но это будет серьезно осложнить вашу установку , и это маловероятно работать так, как вы планируете. Я настоятельно рекомендую против этого.
2 ТБ не-отказоустойчивого пространства не будет скопировано ZFS на автономные диски, извините, если это неясно. Я предлагал сделать резервную копию с помощью обычных операций синхронизации диска, таких как rsync
.
Это означает, что ZFS не знает об этих 2 x 1 ТБ, и что вы создаете какую-то другую файловую систему в пространстве. Да, вы можете сделать это, но, опять-таки, это серьезно усложнит вашу настройку, откровенно говоря, то, что кажется очень небольшим выигрышем.
Предполагая, что № 1 верно, когда мне в конечном итоге понадобится больше места, если я добавлю один диск 4 ТБ или 6 ТБ в массив, будет ли просто расширить пул, чтобы он стал массивом 4 x 4 x 4 ТБ, или я нужно найти где-то, чтобы спрятать 6 ТБ данных при обновлении массива?
Как я уже говорил выше, ZFS vdevs и пулы могут быть расширены как оперативная операция, если вы делаете это путем постепенной замены устройств. (Однако, невозможно сжать пул ZFS или vdev.) Однако вы не можете добавить дополнительные устройства к существующему vdev (например, к устройству RAIDZ с тремя устройствами, которое вы планируете создать); совершенно новый vdev должен быть добавлен в пул, а затем записываемые данные распределяются между двумя vdevs в пуле. Каждый vdev имеет свои собственные требования к резервированию, но они могут совместно использовать горячие резервы. Вы также не можете удалить устройства из vdev, за исключением зеркал (когда удаление устройства только снижает уровень избыточности этого конкретного зеркала vdev и не влияет на объем доступного для пользователя пространства хранения), и вы не можете удалить vdevs из бассейна. Единственный способ сделать последнее (и, как следствие, единственный способ исправить некоторые ошибки конфигурации пула) - воссоздать пул и перенести данные из старого пула, возможно, с помощью резервных копий, в новый пул.
2 ТБ не отказоустойчивого пространства - не такая уж большая проблема, потому что я планировал выделить около 2 ТБ для «вещей, которые нуждаются в надлежащем резервном копировании» (личные фотографии, компьютерные снимки и т.д.), Которые я бы отразил на оставшиеся Диск 2TB и 2-й внешний накопитель 2TB, который я буду хранить где-то еще.
Резервирование ZFS на самом деле не рассчитано на случай использования автономного резервного копирования на дисках. Я расскажу об этом немного подробнее: будет ли работать ZFS-зеркало с одним диском в основном в автономном режиме? Но главное, что лучше использовать zfs send
/zfs receive
для копирования содержимого файловой системы ZFS (включая моментальные снимки и другие периферийные устройства) или простой rsync
если вам не нужны моментальные снимки, чем для использовать зеркала в основном в автономном режиме.
Если я использую половину своих дисков для отказоустойчивости, я мог бы просто использовать традиционные автономные резервные копии.
По общему признанию это сильно зависит от вашей ситуации. Каково ваше время на восстановление требований в разных ситуациях? RAID - это время безотказной работы и время восстановления, а не защита данных; в любом случае вам нужны резервные копии.