Учитывая файл данных, разделенный табуляцией (или другой разделитель), как бы вы вычислили среднее значение столбца?
Жаль, что нет простых двоичных файлов, которые выполняют простые математические операции над файлами такого типа.
Учитывая файл данных, разделенный табуляцией (или другой разделитель), как бы вы вычислили среднее значение столбца?
Жаль, что нет простых двоичных файлов, которые выполняют простые математические операции над файлами такого типа.
awk -F'\t' '{ sum += $1 } END { print sum / NR }'
Здесь $1
является первым \t
ab-разделенным столбцом.
Если у вас установлен R, вы также можете использовать:
Rscript -e "(mean(read.table(\"file.tab\")))"
Вы также можете изменить функцию (среднее) на другие статистические функции, скажем:
Rscript -e "(mean(read.table(\"file.tab\")))"
Rscript -e "(sd(read.table(\"file.tab\")))"
Rscript -e "(summary(read.table(\"file.tab\")))"
Если вы хотите указать столбец, скажем, использовать столбец 3, то вы используете обозначение [, 3]
Rscript -e "(sum(read.table(\"file\")[,3]))"
Наслаждайтесь!