1

В настоящее время я занимаюсь настройкой достойного домашнего NAS. Главной заботой является целостность данных, и поэтому я решил использовать ZFS в качестве файловой системы. К сожалению, это накладывает некоторые требования (или, точнее, рекомендации) на аппаратное обеспечение, что делает его довольно дорогим решением. Это запрещает мне выполнять резервное копирование вне сайта в аналогичной системе, и поэтому я ищу альтернативное решение.

В идеале у меня должно быть три съемных жестких диска, один из которых будет находиться рядом с сервером и подключаться еженедельно или около того. Другие останутся за пределами площадки, и они будут время от времени вращаться. Я знаю, что это представляет риск для новых данных, но я планирую поддержать это альтернативным способом.

Вопрос в том, что я должен поставить на съемные диски. Изначально я думал о том, чтобы установить zpool для каждого и использовать zpool send и zpool recv для их обновления, как здесь. Однако я думаю, что вполне возможно, что диски "повреждены", когда мне нужно будет восстановить резервную копию, и я хотел бы, чтобы ZFS позаботилась об этом. В идеале все три съемных диска должны быть в зеркальной конфигурации до двух перестановок дисков назад, что позволит ZFS использовать их все для устранения проблем со старыми данными при восстановлении резервной копии. Однако накопители никогда не будут подключены одновременно, поэтому это может быть невозможно. Предоставляет ли ZFS средство для реализации того, что мне нужно, или я должен использовать другой метод?

1 ответ1

1

К сожалению, это накладывает некоторые требования (или, точнее, рекомендации) на аппаратное обеспечение, что делает его довольно дорогим решением. Это запрещает мне выполнять резервное копирование вне сайта в аналогичной системе, и поэтому я ищу альтернативное решение.

Я не знаю ваших точных потребностей в оборудовании и производительности, но имейте в виду, что достойные системы могут быть довольно дешевыми, если вы знаете, что ищете, и можете принять некоторые незначительные недостатки. В частности:

  • Количество необходимой оперативной памяти, которую вы находите в сети, значительно завышено, поскольку оперативная память дешева по сравнению с десятками дисков, а оперативная память является критически важной для производительности (так как она используется для ARC и дедупликации). Если вам нужно только насыщать канал Ethernet 1 Гбит / с (~ 110 МБ / с) и иметь в основном потоковую рабочую нагрузку (что означает, что к диску вместо оперативной памяти обращаются постоянно), достаточно от 4 до 8 ГБ памяти (даже 2 ГБ могут все еще работать) ,
  • Корпоративные диски со скоростью 7200 об / мин, разъемами SAS, низким количеством ошибок и пропускной способностью 200 МБ / с хороши, но также не нужны. Два простых потребительских диска со скоростью 5200 об / мин могут насытить вашу сеть без проблем. Случайное чтение будет медленнее, но у вас нет сотен клиентов, которые хотят обращаться к разным файлам каждую секунду.
  • HBA от LSI с 8 портами SAS является надежным выбором, но может быть дорогостоящим. Большинство аппаратных портов SATA на серверных платах от Intel и также достаточно надежны. Они также потребляют меньше энергии. Опять же, скорость здесь не имеет значения, так как у вас нет SSD, вы не используете многолучевое распространение или экстендеры.
  • Мощность процессора практически не имеет смысла, все современные серверные процессоры имеют достаточно мощности. Некоторые двухъядерные Celeron в диапазоне 30 € также поддерживают память ECC, кроме того, вы можете использовать маломощные SoC Atom или двухъядерные процессоры с низким энергопотреблением или четырехъядерные процессоры от AMD. Эти платы также часто уже имеют 6 портов SATA и PCIe для последующего расширения, а также поддерживают от 16 до 64 ГБ памяти, по цене около 300 евро, включая ЦП, память и блок питания.
  • Кроме того, есть несколько предложений серверов SoHo от крупных компаний, таких как Dell или HP, где вы можете получить полный сервер за 300 € (экономия от масштаба), включая корпус, диск и гарантию. Возможности расширения ограничены, но от 4 до 6 дисков еще достаточно.
  • Наконец, если вы живете где-то, где электроэнергия дешева, вы можете посмотреть на используемое оборудование предприятия. Эти системы бывают быстрыми, долговечными и дешевыми, но при этом громкими и энергоемкими. Вы должны рассчитать, стоит ли компромисс.

Однако я думаю, что вполне возможно, что диски "повреждены", когда мне нужно будет восстановить резервную копию, и я хотел бы, чтобы ZFS позаботилась об этом. В идеале все три съемных диска должны быть в зеркальной конфигурации до двух перестановок дисков назад, что позволит ZFS использовать их все для устранения проблем со старыми данными при восстановлении резервной копии.

На мой взгляд, очень маловероятно, что ваша живая система с хотя бы двухсторонним зеркалом и тремя внешними дисками погибнет одновременно. Если одна из резервных копий все еще будет использоваться, вы потеряете только данные за неделю, что гораздо менее серьезно (и может быть уменьшено, например, путем дифференциального оперативного резервного копирования только вновь измененных файлов).

Но если предположить, что это произойдет, давайте сравним все возможные конфигурации резервного копирования (каждый раз, предполагая, что ваша живая система имеет 2 диска в качестве зеркал и все 5 дисков имеют одинаковый размер):

3 независимых диска, send/recv используется для синхронизации данных в 3 пула

  • Диски не могут исправить битовые ошибки, но они могут обнаружить их, и вы можете восстановить файлы с других дисков
  • Поскольку они независимы, вы можете хранить их в трех местах и иметь 3 разных резервных копии (в отношении ошибок пользователя, ошибок программного обеспечения).
  • Обработка проста, так как каждый диск / пул обрабатывается одинаково

3 диска как зеркала, send/recv используется для синхронизации данных в 1 пул

  • По сути, полная автономная система с очень хорошей отказоустойчивостью.
  • С другой стороны у вас есть все яйца в одной корзине (кража / огонь)

3 диска в качестве деградированных зеркал, как описано в связанном вопросе

  • Смотрите связанный ответ для плюсов и минусов
  • У вас также есть только одна версия

Итак, в заключение: это зависит от того, что является более важным для ваших потребностей - несколько независимых моментов времени или один, который является более устойчивым к сбоям.

Если вы выберете второе решение, не забудьте также включить регулярные моментальные снимки данных для защиты от таких вещей, как вредоносные программы шифрования (которые могут быть несколько смягчены наличием нескольких дисков). Кроме того, обязательно распределяйте три диска и храните их в разных местах, чтобы избежать пожара / кражи / потери.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .