1

Я новичок в sed и очищаю очень большой файл. Очищенный документ выглядит правильно, но когда я читаю его в свой R, он показывает, что к каждой строке добавляется \016\t в конце каждой строки. Я понял, что \t - это вкладка, а \016 - октябрь (?) но я не совсем понял, как выразить это правильно.

Любая помощь новому пользователю Sed (и рег выражения!) будет принята с благодарностью.

1 ответ1

1

Следующие работы с bash:

sed $'s/\016\t$//' infile >outfile

Регулярное выражение \016\t$ совпадает с восьмеричным 016 и символом табуляции в конце строки. Если эта строка найдена, она заменяется ничем.

Формат строки $'...' требует bash . Я протестировал вышеупомянутое с GNU sed но, как сообщается, оно должно работать и с BSD sed .

Другой метод, который работает с GNU sed без bash :

sed 's/\o016\t$//' infile >outfile

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .