1

У меня большой файл, обслуживающий до 1000+ классов для номеров страниц. Я хотел бы удалить полный синтаксис с текстом в notepad++ через ReGex. Пример: <p>Cillacepro di to tem endelias eaquunto maximint eostrum eos dolorit et laboria estiati<span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span>Cillacepro di to tem endelias</p>

Я бы заменил <span class=”pagenum”><a name=”Page_4” id=”Page_4”>[Pg 4]</a></span> на «», чтобы найти шаблон для двух и трех цифры тоже. Я новичок в этом поиске строк регулярного выражения, поэтому я был бы благодарен, если бы кто-нибудь мог помочь мне с заменой строки для того же самого. С уважением, Аман Миттал

2 ответа2

1

Хотелось бы поблагодарить @AFH за предоставленный общий ответ, который мог бы обслуживать Page, Pg и другие типы. Я представляю, что соответствует <span class="pagenum">.*?</span> будет достаточно, поскольку только этот класс span может содержать данные номера страницы, которые вы хотите удалить. Обратите внимание, что .*? будет соответствовать минимальному количеству произвольных символов, гарантируя, что в совпадении в паре с одинаковыми ведущими. - AFH 12 часов назад

Я также хотел бы поблагодарить @alzaj за правильное направление. Большое спасибо! Спас мой день и усилия! С уважением, Аман Миттал

1

экранируйте квадратные скобки и используйте цифру-сокращение ("/d"), за которым следует знак повторения "+", чтобы соответствовать номерам страниц:

<span class="pagenum"><a name="Page_\d+" id="Page_\d+">\[Pg \d+\]</a></span>

Вы можете проверить приведенное выше регулярное выражение на следующем примере кода:

placeholdertext<span class="pagenum"><a name="Page_4" id="Page_4">[Pg 4]</a></span>placeholdertext
placeholdertext
<span class="pagenum"><a name="Page_111" id="Page_111">[Pg 111]</a></span>
placeholdertext<span class="pagenum"><a name="Page_222" id="Page_222">[Pg 222]</a></span>

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .