Я пытаюсь удалить строки файла CSV, где два столбца содержат частично одинаковое значение, например так:

ColA                     ColB                 ColC       ColD
mydom/users/michael      mydom2\michael       blabla     false
mydom/users/julia        mydom2\sandra        blabla     true
mydom/users/charlie      mydom2\charlie       blabla     false
mydom/users/max          mydom2\albert        blabla     false

Если ColA содержит то же имя после последней косой черты (например, michael), что и ColB после обратной косой черты (как в строках 1 и 3), тогда вся строка должна быть удалена.

Есть ли способ использовать удаление дубликатов с особыми критериями? Нужна помощь с этим, спасибо.

1 ответ1

0

С Powershell,

Select-String -n -path file.csv -Pattern "/([^/,]+).*\\\1" | select -exp Line

-n возвращает несоответствие, шаблон - это условия, которые вы хотите (с дополнительной проверкой разделителя файла CSV). После тестирования вы можете добавить > new_file.csv в конце строки.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .