Одним из наиболее распространенных опечаток является повторение одного и того же слова дважды, как здесь. Мне нужна автоматическая процедура, чтобы удалить все повторяющиеся слова в текстовом файле. Это не должно быть странной функцией для современного редактора или средства проверки орфографии, например, я помню, что MS Word представил эту функцию несколько лет назад! Очевидно, что проверка орфографии по умолчанию в моей ОС (hun-spell) не может этого сделать, поскольку она находит только слова, не входящие в словарь.
Было бы хорошо иметь решение, допустимое для конкретного редактора текстового редактора для linux (pluma/gedit2 или Sublime-text) и решение, основанное на сценарии bash.