У меня есть файл, содержащий целые числа (номера строк) и текст. Извлекая PDF-файл, эти номера строк помещаются в отдельные строки текста, и я хочу удалить все эти номера строк. Я не очень хорошо разбираюсь в регулярных выражениях, но я на 100% уверен, что это не должно быть слишком сложно. Я использую vim/nvim, но если бы мне пришлось использовать awk/sed, это бы сработало и для меня.
Файл выглядит примерно так:
123
124
125
Text was found in
those three lines
should stay
Поэтому в идеале я хочу найти: все строки, которые начинаются с положительного целого числа (1,2,3 ... 123456) и не содержат ничего, кроме этого целого числа. Они должны быть удалены.
Буду признателен за любую оказанную помощь.
Бонусный вызов: по какой-то причине некоторые строки начинаются с ^L1234
, поэтому есть дополнительный специальный символ. В какой-то момент я бы тоже хотел их удалить. Может быть отдельные шаги, хотя.