3

Учитывая файл данных, разделенный табуляцией (или другой разделитель), как бы вы вычислили среднее значение столбца?

Жаль, что нет простых двоичных файлов, которые выполняют простые математические операции над файлами такого типа.

2 ответа2

8
awk -F'\t' '{ sum += $1 } END { print sum / NR }'

Здесь $1 является первым \t ab-разделенным столбцом.

3

Если у вас установлен R, вы также можете использовать:

Rscript -e "(mean(read.table(\"file.tab\")))"

Вы также можете изменить функцию (среднее) на другие статистические функции, скажем:

Rscript -e "(mean(read.table(\"file.tab\")))"
Rscript -e "(sd(read.table(\"file.tab\")))"
Rscript -e "(summary(read.table(\"file.tab\")))"

Если вы хотите указать столбец, скажем, использовать столбец 3, то вы используете обозначение [, 3]

Rscript -e "(sum(read.table(\"file\")[,3]))"

Наслаждайтесь!

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .