Существует ли какая-либо утилита сравнения файлов, которая может помочь мне сравнить куски текста из двух текстовых файлов?

Например, я хочу знать, какие фрагменты текста в одном файле можно найти снова во втором файле. То, что мне нужно сделать, это больше похоже на операцию «сравнивать и искать», а не просто сравнивать строку за строкой.

Мне это нужно для поиска распространенных ошибок в журналах приложений. Например, у меня есть Java-приложение и логи двух разных дней. Я хочу выяснить, какие следы стека (которые на самом деле являются кусками текста внутри текстового файла) являются общими для обоих дней.

2 ответа2

1

Вы можете попробовать любое количество бесплатных инструментов сравнения - я использовал KDiff3, который является хорошим инструментом с открытым исходным кодом, доступным на нескольких различных платформах. Я смог использовать его для сравнения нескольких файлов журналов - есть визуальная индикация того, какие линии различны и общие для этих файлов (цвета для различий, белый / нет цвета для общих линий).

Возможно, вам придется немного поэкспериментировать, чтобы настроить приложение, чтобы сделать именно то, что вы ищете, но это хорошее начало.

1

Нулевое время упомянул CompareIT

  • Он может обнаружить перемещенные секции и показать эти блоки
  • Он поддерживает RE, поэтому вы можете игнорировать некоторые части строк, выполняющих операции
  • Правила Automatch помогают при сравнении структурированных источников

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .