Я пишу небольшой скрипт, который получает различную статистику о двух разных расширениях файлов (* .parquet ИЛИ * .metadata) в произвольном каталоге. Мне нужно получать эту статистику только по файлам, которые были изменены / созданы за последние 24 часа
TD=${1:-`pwd`}
find $TD -maxdepth 1 -type f -mtime -1 -name "*.parquet" -o -name "*.metadata" | wc -l
find $TD -maxdepth 1 -type f -mtime -1 -name "*.parquet" | wc -l
find $TD -maxdepth 1 -type f -mtime -1 -name "*.metadata" | wc -l
Первая строка выводит 60540
Вторая строка выводит 430
Третья строка выводит 430
Ожидаемый результат для первой строки будет суммой второй и третьей строк (или второй и третьей строк будет первая строка firstline / 2
То, что я пытаюсь сделать, это перечислить все файлы, которые заканчиваются либо расширением .parquet ИЛИ .metadata, и подсчитать общее количество файлов для обоих расширений, общий размер файлов для каждого расширения, средний размер файла для каждого расширения, сумму все размеры файлов
Найти статистику легко, это просто список файлов, которые меня отталкивают. Что я делаю неправильно?