Я получил массивный документ с текстом. Я хочу отметить все URL, заканчивающиеся на .se

Мне удалось пометить часть URL непосредственно перед .se с помощью \w+\.se . Но некоторые из этих URL получили 3-4 поддоменов.

Поэтому, если у меня есть example.example.example.se, мне удалось отметить последний example.se, но я хочу отметить все это.

Изменить: Чтобы было ясно, мне нужно пометить все URL, чтобы осудить их. Использование \w+.se помечает «example.se» в «example.example.se» \w+. \ W +.se не помечает URL, которые являются просто «example.se», но помечает «example.example.se».

Сначала я подумал, что могу сделать это один раз для каждого набора поддоменов. Но проблема - первый пример в редактировании. Он заменит более позднюю часть домена, но первые субдомены останутся, и я не смогу запустить seq. в цепи. Потому что тогда это будет «example.censured» (это раньше было «example.example.se»).

Имею ли я какой-то смысл? Не уверен, как выразить проблему словами ...

1 ответ1

1

Просто разрешите часть \w+\. повторить: (\w+\.)+se .

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .