Какую команду я использую, чтобы найти размер всех файлов (рекурсивно) в каталоге Linux или Mac OS X?
5 ответов
Версия du
BSD, используемая в OS X, сообщает о размере с 512-байтовыми блоками - размеры по существу округлены до следующего 512-байтового значения. Это говорит о том, что место на диске больше, чем объем данных. Если у вас много маленьких файлов, разница может быть большой.
Вот пример.
Это значение с обычным du
. Это в 512-байтовых блоках:
$ du -s
248 .
Флаг -h
приводит к более читаемому числу в килобайтах. Как и ожидалось, это половина количества 512-байтовых блоков:
$ du -hs
124K .
Наконец, вы можете использовать find
и awk
чтобы получить сумму фактических байтов в файлах. Это немного медленно, но работает:
$ find . -type f -exec ls -l {} \; | awk '{sum += $5} END {print sum}'
60527
Это значение в точности совпадает с числом, сообщаемым окном Get Info программы Finder (В этом наборе файлов нет странных вилок или xattrs.) Это значительно меньше, чем значение, сообщенное du
.
Вот как это работает: он получает список всех файлов и передает их в ls -l
; затем awk
используется для подсчета байтов. Флаг -type f
установлен так, что в ls
отправляются только файлы (а не каталоги). Без этого флага он также отправляет имена каталогов в ls
, и каждый файл будет указан дважды: один раз как отдельный файл и один раз как элемент в каталоге.
GNU-версия du
может давать значения в байтах вместо блоков. К сожалению, BSD-версия du
не такая гибкая.
Показать размер одного файла
du -h path_to_a_file
Покажите размер содержимого каталога, каждого подкаталога и каждого отдельного файла:
du -h path_to_a_directory
Показать размер содержимого каталога:
du -sh path_to_a_directory
du - указывает на использование диска, а не на размер файла.
find . -type f -print0 | xargs -0 stat -f%z | awk '{b+=$1} END {print b}'
Код терминала выше (im на OSX 10.6) предлагает для меня лучший результат и работает быстрее, чем «find ... -exec»
быстрый тест
time find . -type f -print0 | xargs -0 stat -f'%z' | awk '{b+=$1} END {print b}'
4744010970
real 0m0.086s
user 0m0.029s
sys 0m0.073s
time find . -type f -exec ls -l {} \; | awk '{sum += $5} END {print sum}'
4744010970
real 0m18.515s
user 0m2.929s
sys 0m9.339s
Вы можете использовать du -ah .
который отображает размеры всех файлов и каталогов рекурсивно.
Это можно комбинировать с sort
, так что вы увидите 20 самых больших каталогов в текущей папке:
du -ah . | sort -rh | head -20
Примечание: опция -h
для sort
недоступна в OSX/BSD, поэтому вы должны установить sort
из coreutils
(например, через brew
) и применить путь к корзине для PATH
, например
export PATH="/usr/local/opt/coreutils/libexec/gnubin:$PATH" # Add a "gnubin" for coreutils.
В противном случае используйте:
du -a . | sort -rn | head -20
Я объединил все ваши приложения и объединил их с удобочитаемым выводом:
#!/bin/sh
find $1 -type f -print0 | xargs -0 stat -f'%z' | awk '{b+=$1} END {print b}' | awk '{ sum=$1 ; hum[1024**3]="Gb";hum[1024**2]="Mb";hum[1024]="Kb"; for (x=1024**3; x>=1024; x/=1024){ if (sum>=x) { printf "%.2f %s\n",sum/x,hum[x];break } }}'
Ссылка на суть: https://gist.github.com/mlegenhausen/9365461