Я хочу сравнить два файла размером около 40 МБ значений, разделенных запятыми, с такими строками:
hstar, по умолчанию, "T9883Z", 0d59, c801,7332,5,20120914,4.343618767
Для двух файлов последняя запись, которая в приведенном выше примере - 4.343618767
варьируется между двумя файлами, но почти все остальные поля совпадают.
Мне нужно различить два файла, чтобы найти несколько мест, где записи, отличные от последнего, различаются между двумя файлами.
Я думаю, что самый простой способ сделать это - использовать SED для обработки двух файлов и нормализовать последнее поле, отыскивая числовой шаблон после седьмой запятой и заменяя его фиксированной строкой, например, 9.999999999 в каждой строке, а затем простой Дифф будет работать.
Однако я не уверен, как создать команду sed, чтобы найти седьмую запятую и заменить оставшуюся строку до конца строки фиксированной строкой. Как будет выглядеть такая команда sed? Я предполагаю, что мне нужно было бы использовать регулярное выражение, но я не уверен, как запустить шаблон после седьмой запятой.