3

Используя egrep, как я могу напечатать все строки, где фамилии начинаются с K или k?

Jennifer Cowan:548-834-2348:583 Laurel Ave., Kingsville, TX 83745:10/1/35:58900
Lesley Kirstin:408-456-1234:4 Harvard Square, Boston, MA 02133:4/22/62:52600
Jennifer Cowan:548-834-2348:583 Laurel Ave., kingsville, TX 83745:10/1/35:58900
Lesley kirstin:408-456-1234:4 Harvard Square, Boston, MA 02133:4/22/62:52600
William Kopf:846-836-2837:6937 Ware Road, Milton, PA 93756:9/21/46:43500
Arthur Putie:923-835-8745:23 Wimp Lane, Kensington, DL 38758:8/31/69:126000

2 ответа2

3

Первая попытка будет

  grep '^[^ ]*  *[Kk]'

Но это предполагает, что всегда есть только одно имя и никаких инициалов.
В этом примере вы можете использовать опцию -i и заменить [Kk] просто на k

Может быть лучше закрепиться на первом двоеточии

  grep -i ' k[^:]*:'

Если вы действительно хотите напечатать только фамилию, а не всю строку, вам следует рассмотреть возможность использования awk (или perl)


Обновление: вот как создается первое выражение grep '^[^ ]* *[Kk]'

  '     apostrophe delimits a parameter that contains spaces
        and other so-called meta-characters that the shell might alter
  ^     caret means start of line
  [     brackets mark a set of characters, any one of which is to be matched
  ^     inside brackets means negation or 'none of the following'
        so `[^ ]` means "not a space"
  ]     is the end of the set.
  *     means 0,1 or more of the prior character
        so `[^ ]*` means any contiguous group of characters that does not 
        contain a space
  then we have two spaces
  *     means 0,1 or more of the prior character
        so space space * means 1 nor more spaces.
  [Kk]  means `K` or `k`
  [^:]* means 0,1 or more characters that are not a colon
  :     followed by a colon
0
perl -aF/:/ -ne 'print if $F[0] =~ /\s[Kk]\S+$/'
  • С помощью -aF/:/ вся строка разделяется на поля, разделенные двоеточиями;
  • $F[0] - нулевое поле и содержит имена;
  • /\s[Kk]\S+$/ соответствует пробелу (\s), за которым следует K или k , за которым следует любое количество непробельных символов (\S+) до конца поля ($).

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .