14

У меня есть два документа ODT, они имеют очень близкое содержание, я хочу сравнить их, чтобы увидеть, насколько они похожи.

Лучше всего было бы иметь процент сходства, если не возможно, альтернативой было бы, по крайней мере, иметь какой-то тип diff.

Я использую Ubuntu Lucid.


Решение:

Я использовал odt2txt для преобразования файлов в текст, затем использовал wdiff -i --statistics one.txt two.txt чтобы получить diff со статистикой, которая дала мне процент общих слов (сходство).

4 ответа4

20

Вы пробовали встроенную функцию сравнения? Редактировать / Сравнить документ ...

Если вы просто хотите использовать текстовые различия, лучше всего конвертировать оба документа в обычный текст, а затем выполнять регулярные сравнения с ними. Вы должны будете выяснить, как нормализовать переносы строк, иначе разница будет не очень полезна.

7

Я не пробовал их сам, но эта пара инструментов - odt2txt и oodiff - выглядит многообещающе.

1

Если вас не волнует форматирование текста, вы также можете скопировать содержимое в текстовые файлы и использовать старый добрый diff.

ps: вы учитель ищите возможных читеров? :п

1

Я делаю это для создания файлов .pdf с помощью libreoffice, а затем использую diffpdf для сравнения двух файлов pdf. Это показывает различия, выделенные в параллельных окнах

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .