Существует ли быстрая утилита на основе Unix (в идеале написанная на C) для получения эффективного потокового пересечения / объединения текстовых файлов с разделителями табуляции?
Например, разрешите запросы, такие как «дать мне все записи в файле A, которые имеют значение K столбца, которое не отображается ни в одном столбце K файла B».
Например, если файл A:
bob sally sue
bob mary john
и файл B:
john sally sue
foo bar quux
тогда дополнение файла A относительно столбца B в столбце 2 вернет "bob mary john", поскольку это единственный файл B, имеющий значение в столбце 2, которое отсутствует в файле B.
Я бы предпочел не использовать базу данных, но мне нужна утилита на основе командной строки. Является ли AWK ответом или есть что-то более простое?