Учитывая текстовый файл со строкой, разделенной пробелами, и целым числом, разделенным табуляцией, я бы хотел избавиться от всех слов, которые имеют не-буквенные символы, но оставляют после себя слова, состоящие только из буквенных символов и табуляции плюс целое число.
Мои попытки, подобные приведенным ниже, не принесли никакой пользы. То, что я пытался выразить, это что-то вроде: «замените все, что находится в границах слова, которое начинается и заканчивается 0 или более чем угодно, и есть хотя бы один: digits: или: punct: между».
sed 's/\b.*[:digits::punct:]+.*\b//g'
sed 's/\b.*[^:alpha:]+.*\b//g'
Что мне не хватает? Смотрите пример входных данных ниже.
Спасибо!
Входные данные:
asdf 754m 563
a2a 754mm 291
754n 463
754 ppp 1409
754pin 4652
pin pin 462
754pins 652
754 ppp </D> 1409
<D> 754pin 4652
pi$n pin 462
754/p ins 652
754 pp+p 1409
754 p=in 4652
Желаемый результат:
asdf 563
291
463
ppp 1409
4652
pin pin 462
652
ppp 1409
4652
pin 462
ins 652
1409
4652