У меня есть два документа ODT, они имеют очень близкое содержание, я хочу сравнить их, чтобы увидеть, насколько они похожи.
Лучше всего было бы иметь процент сходства, если не возможно, альтернативой было бы, по крайней мере, иметь какой-то тип diff.
Я использую Ubuntu Lucid.
Решение:
Я использовал odt2txt
для преобразования файлов в текст, затем использовал wdiff -i --statistics one.txt two.txt
чтобы получить diff со статистикой, которая дала мне процент общих слов (сходство).