1

Я работаю с большими наборами данных (1TB-2TB) секвенирования генома. Недавно мы потеряли некоторые важные данные на рабочей станции Dell. Мы планируем регулярно хранить и резервировать наши данные на ежедневной основе. Я слышал о RAID, но не уверен, какая RAID-система (0,1,5,10 ..) лучше всего подходит для наших целей.

4 ответа4

2

Если вы планируете использовать более 2 жестких дисков, RAID 5 будет наиболее подходящим для ваших целей. Использование n жестких дисков RAID 5 обеспечивает емкость n-1 дисков для использования, в то же время позволяя одному диску выйти из строя.

Например, если вы используете 5 жестких дисков емкостью 2 ТБ каждый, вы можете эффективно использовать 2 *(5-1) = 8 ТБ, одновременно обеспечивая допуск на один неисправный диск.

В отличие от этого, вы также можете использовать RAID 1 или RAID 10/0+1, что в основном означает, что вы зеркалируете свои данные. Используя n = 2 диска, вы можете эффективно использовать хранилище 1 диска, используя другой для зеркалирования (это фактически RAID 1). С n ≥ 4n четным) вы можете комбинировать зеркалирование с чередованием, чтобы эффективно использовать n/2 дисков для хранения.

Это зависит от сценария, подходит ли RAID 5 или составной RAID 10/0+1.


Примечание: даже если вы используете какой-либо тип RAID - обязательно сделайте резервную копию ваших данных! RAID никогда не заменяет резервную копию!

Представьте себе файл, который был случайно удален / перезаписан из вашей системы RAID - этот файл будет потерян навсегда, так как он также будет удален / перезаписан на зеркальных / реплицирующих дисках.

1

Я бы сказал, RAID5 по размеру, стоимости, скорости, доступности данных (избыточность), типу использования и т. д ...

Повторить: RAID не является резервной копией; пожалуйста всегда имейте хотя бы 1 проверенную резервную копию ..

Массив ОС: RAID-массив без четности (0,1,10) предпочтителен для ОС, так что накладные расходы на вычисления четности в WRITE для CONSTANT winRegistry и файла виртуальной памяти / пейджинга не приводят к перегрузке системы (как это было бы в RAID5,6,50). , 60 для любых записей или ухудшенных чтений массива).

RAID0 Array:

RAID является избыточным массивом и т. Д .; поэтому RAID 0 является своего рода оксюмороном в том смысле, что это не избыточный-избыточный массив Indep. Диски; Это единственный уровень RAID, который не обеспечивает более высокую доступность данных (только увеличение скорости и места).

Массив не-OS: для массивов не-OS (приложения, данные, база данных) у нас может быть гораздо больше операций чтения, чем записи (поэтому без вычисления четности, если массив не ухудшен / отсутствует HD). Итак, немного меняется. Кроме того, некоторые базы данных специально настроены для чтения с полосы через 0,5,6,10,50,60, которая будет считывать полосу через (не RAID1 или 01). При загрузке базы данных, в которой есть собственное программное кэширование, лучше отключить аппаратное кэширование RAID через контроллер RAID.

Массив: RAID 5 может быть самым дешевым избыточным массивом для развертывания в разумных пределах (RAID0 дешевле, но не избыточен).

обслуживание массива: резервное копирование, проверено. Обновления Сбрасывайте до первоначальной избыточности / зеркала / четности ежемесячно, чтобы прочесать все плохие блоки перед тем, как HD выйдет из строя. В единственной отказоустойчивой схеме массива, хотелось бы, чтобы остальная часть массива была нетронутой; когда HD выходит из строя / падает в автономном режиме. Контроллер RAID, настроенный на более узкие допуски, может быть лучшим контроллером, требующим большего; но, похоже, больше не удалось или просто HD отключился в автономном режиме ..

количество HD в полосе по всему массиву: чтение по полосе будет быстрее с более широкой полосой (больше hd), замедляющейся в RAID5 относительно HD8 (9-й диск), поскольку накладные расходы из расчета четности становятся такими огромными; Предположим, что эта парадигма используется ранее в типах RAID6 с двойной четностью Чем больше HD в полосе массива, тем больше вероятность того, что 1 перестанет работать в автономном режиме и его необходимо будет перестроить обратно в последовательность массива. НО Кроме того: чем больше HD в массиве, тем больше вероятность того, что при сбое жесткого диска и плохом блоке данных его не будет на отказавшем жестком диске, и, следовательно, PUNCTURE единственный отказоустойчивый массив.

Двойное резервирование в массиве: RAID6 может быть более популярным на массиве HUGE или более критичным; но не скорость двойная отказоустойчивость. Когда вы перестраиваете, пользуйтесь большей вероятностью двойного сбоя в отказоустойчивом массиве (увеличивая риск / подверженность) при перестроении массива большего размера. Большие многоуровневые массивы (10,50,60 и т.д.) Могут иметь еще большую отказоустойчивость, чтобы противостоять текущим рискам, а также восстанавливать неисправности.

обслуживание X количество HD в массиве: чем больше HD, тем выше вероятность 1 падения в автономном режиме; чем выше вероятность прокалывания массива = тем больше риск / осторожность при работе с большим массивом.

1

Похоже, вам нужен RAID 1: данные записываются одинаково на два диска.

Если наборы данных, которые вы храните, очень очень велики (вы храните их на более чем 1 диске), вы можете использовать RAID 5 (данные копируются на другой диск со специальной контрольной суммой, которая позволит вам восстановить все ваши данные в случае сбоя одного из дисков). )

Источник: http://en.wikipedia.org/wiki/RAID#Standard_levels

NB: Raid 0 улучшает производительность, но не безопасность данных, Raid 10 хорош, когда вы используете много дисков (минимум 4)

0

Вы должны пойти на RAID1 или RAID5. Выбор зависит от вашего бюджета, с одной стороны, а с другой - места, необходимого для ваших данных. :

  • С raid1 вы можете добиться высокой отказоустойчивости, но доступное пространство будет таким же, как если бы у вас был только один диск. Raid5 имеет более низкую отказоустойчивость (только один диск), но у вас более высокая эффективность использования пространства, поэтому доступное пространство будет зависеть от количества дисков (и оно становится лучше, чем raid1, если у вас более 3 дисков).
  • С точки зрения производительности, raid1 немного лучше при чтении, тогда как raid5 значительно лучше при записи.
  • Вы можете собрать raid1 с минимум двумя дисками, тогда как для raid5 вам потребуется как минимум три (но вам понадобится диск меньшего размера, чтобы получить то же пространство, что и в raid1).

И, как сказал оратор,

RAID никогда не заменяет резервную копию!

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .