Я пытаюсь распечатать уникальные записи в столбце файла .csv . Для этого я попробовал следующее:

awk -F "," '{print $6}' dataCoarse.csv | uniq -u

который просто печатает 6-й столбец как есть. Есть все еще повторяющиеся записи. Как я могу печатать только уникальные линии?

Edit: я думаю, что мне нужно удалить пробелы, предшествующие или завершающие любой символ в каждой строке, или uniq каким-то образом игнорировать их. Как я могу это сделать?

1 ответ1

1

У меня тоже была эта пробема! Проверьте это решение аналогичной проблемы. По сути, вы хотите сначала sort данные для сортировки , так как uniq считает только последовательные экземпляры ваших данных как дубликаты.

awk -F "," '{print $6}' dataCoarse.csv | sort -u должен дать вам результат, который вы ищете.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .