Корпоративные хранилища, такие как системы от EMC, NetApp и т.д., Имеют свои собственные алгоритмы и методы, гарантирующие, что данные не будут потеряны. В случае подключения нескольких серверов к такой системе хранения, будут ли какие-либо преимущества, если я буду использовать ZFS в качестве файловой системы? Не обеспечат ли собственные возможности хранилища максимально возможную целостность данных, сжатие, дедупликацию и т.д., Делая излишними все мои усилия? Таким образом, не предпочтительнее ли в этом случае XFS, UFS или какая-либо другая файловая система?
2 ответа
Как сказал Эндрю Хенле, у вас нет никаких гарантий, что эта система хранения данных «черного ящика» будет делать то, что вы хотите. Конечно, вполне вероятно, что он уже делает все, что вы хотите, возможно даже, что он использует ZFS внутри, но вы не знаете наверняка. И даже если вы точно знаете, вы, скорее всего, не сможете полностью настроить его по своему вкусу.
Итак, у вас есть три возможных ситуации, в которых вы можете оказаться:
- Вы ничего не знаете о системе и не можете настроить ее каким-либо значимым образом. В этом случае большая часть облачного хранилища упадет, как и системы хранения в крупных корпорациях, где вы просто получаете "хранилище" определенного размера, запрашивая его, если вам это нужно для ваших проектов.
- Вы знаете, как работает и настраивается система, но вы не можете настроить ее самостоятельно.
- Вы знаете, как он работает, и можете активно его модифицировать (либо сами с помощью предоставленных привилегий, либо сообщая об этом администратору). Скорее всего, в небольших операциях, где вы знаете друг друга или где люди знают, что разные потребности должны быть удовлетворены.
Это приводит к следующим ответам на вопрос «Является ли ZFS на вершине выгодным, просто тратой или даже проблематичным?«:
- Поскольку у вас нет никаких гарантий, вы получаете практически все функции за единственным недостатком производительности. Возможно, вам придется много тестировать и тестировать, чтобы выяснить, как работает система, но может случиться так, что вы никогда не получите достаточно хорошую производительность. Конечно, все может быть напрасно, но, как вы не знаете, вы остаетесь в безопасности.
- Как и 1, но теперь, когда вы знаете, как это работает, вы можете оптимизировать производительность намного лучше или в худшем случае узнать, почему ваша производительность плохая. Вы также знаете, какие функции у вас уже есть, поэтому вы можете принять более обоснованное решение, если функции ZFS того стоят в вашем случае.
- Как и 2, но теперь, когда вы можете активно настраивать и оптимизировать систему хранения, еще более вероятно, что вам не понадобится ZFS сверху. И даже если вы это сделаете, вы можете совместить оба, чтобы минимизировать потерю производительности.
Исследования CERN показывают, что даже очень дорогие системы хранения страдают от гниения. Кроме того, их исследования показывают, что ZFS не страдает от гниения. Кроме того, независимые исследователи в области компьютерных технологий также показывают, что ZFS не страдает от гниения. По этой причине CERN перешел на ZFS. Кроме того, суперкомпьютер IBM Sequoia использует Luster для хранения 55 петабайтных данных. Luster - это параллельная система хранения, которая использует ZFS для фактического хранения на диске. Google CERN и ZFS, и вы увидите много научных работ по целостности данных. Кроме того, статья в Википедии о ZFS содержит исследования по целостности данных.