У меня есть файл с содержанием, похожим на:
google.com,9,AB+CD,nonAB+nonCD
youtube.com,9,AB+CD,AB+CD
facebook.com,20,AB+CD,nonCD
Количество столбцов не фиксировано. Но первый столбец - это URL, второй - это число, начиная с третьего - ключевые слова, разделенные запятыми, но они различаются на разных сайтах.
Я хочу посчитать количество URL (строк), где я могу контролировать, какие ключевые слова в строке. Например,
1) AB+CD
без nonAB
и nonCD
. Примечание: слово AB+CD может встречаться много раз.
2) AB+CD без появления nonCD
(но это нормально, если есть что-то еще)
Как искать строку в строке И обеспечить отсутствие другой строки. Когда я использую:
grep 'AB+CD' test.txt > result.txt
Он печатает каждую строку, где находится «AB +CD».
Что делать, если я хочу напечатать строку, где есть только 'AB+CD':
youtube.com,9,AB+CD,AB+CD
Или есть «AB +CD» с чем-то еще, кроме «nonAB», чтобы получить:
youtube.com,9,AB+CD,AB+CD
facebook.com,20,AB+CD,nonCD