Быстрая команда для вычисления среднего значения столбца в текстовом файле в bash

Question

Учитывая файл данных, разделенный табуляцией (или другой разделитель), как бы вы вычислили среднее значение столбца?

Жаль, что нет простых двоичных файлов, которые выполняют простые математические операции над файлами такого типа.

score 8 · Accepted Answer · 2011-03-09T19:38:42

awk -F'\t' '{ sum += $1 } END { print sum / NR }'

Здесь $1 является первым \t ab-разделенным столбцом.

score 3 · Answer 2 · 2011-03-09T19:38:42

Если у вас установлен R, вы также можете использовать:

Rscript -e "(mean(read.table(\"file.tab\")))"

Вы также можете изменить функцию (среднее) на другие статистические функции, скажем:

Rscript -e "(mean(read.table(\"file.tab\")))"
Rscript -e "(sd(read.table(\"file.tab\")))"
Rscript -e "(summary(read.table(\"file.tab\")))"

Если вы хотите указать столбец, скажем, использовать столбец 3, то вы используете обозначение [, 3]

Rscript -e "(sum(read.table(\"file\")[,3]))"

Наслаждайтесь!

2 ответа2