У меня есть текстовый файл, подобный следующему:
1 2 3 4 5 6 7 8 9 ... n <-- column numbering
1 0 0 1 0 0 0 1 0 ... 0
0 1 0 0 0 0 0 0 0 ... 1
1 0 0 0 0 0 0 1 1 ... 0
0 1 1 1 0 1 0 0 0 ... 0
0 1 0 0 1 0 1 0 1 ... 1
На самом деле это очень разреженная матрица, где двоичные значения. В каждом ряду должно быть больше одной 1, а в каждом столбце как минимум одна 1.
Что я хочу сделать, это выяснить, какие столбцы, скажем, менее 2 1 с. Например, в моей матрице выше я хотел бы избавиться от столбцов 3, 5, 6 и 7, потому что они имеют только один 1.
Есть ли команда UNIX, чтобы сделать это? Возможно, мне нужна команда Group by-like (SQL), а затем отслеживать, какие столбцы меньше определенного числа, но я не понимаю, как я мог это сделать.