Я получил массивный документ с текстом. Я хочу отметить все URL, заканчивающиеся на .se
Мне удалось пометить часть URL непосредственно перед .se с помощью \w+\.se
.
Но некоторые из этих URL получили 3-4 поддоменов.
Поэтому, если у меня есть example.example.example.se, мне удалось отметить последний example.se, но я хочу отметить все это.
Изменить: Чтобы было ясно, мне нужно пометить все URL, чтобы осудить их. Использование \w+.se помечает «example.se» в «example.example.se» \w+. \ W +.se не помечает URL, которые являются просто «example.se», но помечает «example.example.se».
Сначала я подумал, что могу сделать это один раз для каждого набора поддоменов. Но проблема - первый пример в редактировании. Он заменит более позднюю часть домена, но первые субдомены останутся, и я не смогу запустить seq. в цепи. Потому что тогда это будет «example.censured» (это раньше было «example.example.se»).
Имею ли я какой-то смысл? Не уверен, как выразить проблему словами ...