У меня есть HTML-файл, который содержит много /<| ^, некоторые тексты помимо заголовков мусора, слова и т.д. Я хочу извлечь несколько текстов между набором букв, таких как "nbsp" и труба «|». Я теряю информацию, если использую «delims = nbsp», так как delims считает их "n", "b", "s" и "p". Как я должен подойти к проблеме, и как я могу извлечь множество текстов?

Пример текста:

garbage nbsp; SOME_TEXT_1 | garbage
garbage nbsp; SOME_TEXT_2 | garbage
garbage nbsp; SOME_TEXT_3 | garbage

1 ответ1

0

Если текст действительно такой же простой, как ваш пример, это будет сделано;

for /f "delims=^|; tokens=2" %a in (garbage.txt) do echo %a

Если окружающий текст содержит больше точек с запятой, вам, вероятно, будет проще получить Windows-версию sed или awk. Или любой хороший текстовый редактор, если это одноразовая работа.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .