Вы можете использовать регулярное выражение для удаления последовательных дублированных слов в строке, однако я не думаю, что возможно удалить дублированные слова, которые не являются последовательными (например, dangerous, hazardous, dangerous
).
Используйте это регулярное выражение в окне замены в Notepad++, и не забудьте выбрать "Регулярное выражение" в качестве параметра "Режим поиска" ниже:
Это регулярное выражение удалит все подряд дублированные слова - будь то 2 дублированных слова или 10 дублированных слов подряд: \b(\w+)(?:,\s+\1\b)+
.
Точно такое же регулярное выражение без запятых будет: \b(\w+)(?:\s+\1\b)+
(может быть полезно для других пользователей).
Если вы хотите регулярное выражение только для двух повторяющихся слов (двойников), используйте это регулярное выражение: (\b\w+\b)\W+\1
.
Поместите это регулярное выражение в поле « Заменить на», чтобы сохранить одно вхождение слова (в противном случае все повторяющиеся слова будут удалены): ${1}
.
Эти регулярные выражения исправят ситуацию, подобную той, что вы описали в своем вопросе в качестве примера. Первое регулярное выражение будет работать для каждого числа дублированных слов (например, dangerous, dangerous, dangerous, dangerous, hazardous
), в то время как вторая версия будет работать только для двух дублированных слов (например, dangerous, dangerous, hazardous
).
Примечание . Регулярное выражение будет применяться только к формату, описанному в вопросе. Это означает, что такие форматы, как two words, two words, anotherword
, two-words, two-words, anotherword
three words expression, three words expression, anotherword
не будут быть изменены, потому что регулярное выражение не будет применяться к ним.