Предполагая 100 КБ на файл, это означает 10 файлов на мег, и:

  • 10K файлов на ГБ
  • 1 миллион файлов на 100 ГБ
  • 10 миллионов файлов на ТБ

Это правильно?

3 ответа3

1

Для большей части, да.

Единственный большой фактор, который может отбросить ваши расчеты, это размеры кластеров. В зависимости от того, какую файловую систему вы используете, наименьшая единица будет кластером или эквивалентным. Файл не может использовать меньше кластера, поэтому, хотя ваши файлы могут занимать X места, а ваш диск имеет размер Y, ваше свободное пространство не обязательно Y - X из-за того, что вы не можете поместить другой файл в наполовину полный кластер, занятый другим файлом.

0

При измерении размеров файлов мы больше заботимся о конверсиях из базы 2, а не из базы 10, поэтому, хотя ваши расчеты примерно верны, они не идеальны. Например, один мегабайт - это не 1000 килобайт, а 1 мегабайт - 1024 килобайта. Когда вы доходите до терабайтов, эта ошибка усугубляется, поэтому количество файлов, которые вы можете разместить в терабайтах, значительно увеличивается. Если мы используем заданные вами параметры (файлы размером ровно 100 килобайт), мы можем фактически разместить 10,995,116 файлов в 1 терабайтном пространстве, что почти на миллион файлов больше, чем вы предложили в исходном расчете! Если пространство имеет решающее значение, важно помнить, что размеры файлов рассчитываются в базе 2, а не в базе 10.

Вы также хотите учесть то, что сказал surfasb, но поскольку размер кластера по умолчанию для большинства систем составляет 4 килобайта, вы не потратили бы впустую никакого пространства, если бы мы использовали заданные вами параметры (файлы размером 100 килобайт, 100/4 = 25 без остатка ).

0

Это правильно?

Только для первого приближения.

Помимо использования дискового пространства для хранения фактического содержимого файла, вам также необходимо учитывать:

  • Отклонение выделения: файловая система выделяет пространство в единицах из N секторов (например, кластеров). Каждый размер файла должен быть округлен до следующего кратного единице выделения. Примечание. Существовала по крайней мере одна файловая система, которая позволяла файлам совместно использовать (разделять) единицу выделения, но это усовершенствование, вероятно, не следует использовать в ваших вычислениях.
  • издержки файловой системы: дисковое пространство, используемое для хранения информации каталога / inodes / metadata / независимо от того, какую файловую систему использует. Если бы каждый файл находился в своем собственном подкаталоге, то было бы использовано больше места на диске, чем если бы все файлы находились только в одном каталоге.
  • Журнализированная файловая система зарезервирует часть дискового пространства для журнала. Будет верхний предел, но фактическое используемое пространство, вероятно, будет динамическим.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .