Когда я пишу запись в блоге Google, в HTML добавляется много записей, как показано ниже (не знаю почему).

<span id="textmarked_8" name="textmarker_9" style="background-color: yellow;"></span>

Как мне их удалить? Обратите внимание, что числа 8 и 9 должны быть заменены некоторым регулярным выражением. Я ищу команду в vi или другую простую команду. Кстати, я использую Ubuntu.

Благодарю.

1 ответ1

2

Вы действительно должны использовать HTML-парсер, а не регулярное выражение (см. Прошлые ответы на эту тему).

Однако, если XML имеет полностью предсказуемый контент и форматирование, вы можете получить что-то вроде

:%s/<span[^>]*><\/span>//

(не проверено). Важным моментом здесь является то, что он проверяет наличие пустого элемента span, который оказывается на одной строке. Вы можете добавить каретку (^) в начале, если нежелательные элементы span всегда начинаются с начала новой строки.

Если вы хотите соответствовать id="textmarked_[0-9]* вы можете сделать это, я сомневаюсь, что это необходимо. Любой пустой элемент span, вероятно, не имеет смысла, независимо от его атрибутов. Единственное исключение, о котором я могу подумать, - это если какой-то элемент javascript позже заполнит эти элементы.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .