5

Я знаю, что об этом уже спрашивали, но у меня есть спина, поскольку я пробовал различные предложения свободного программного обеспечения. Я хочу избавиться от отдела DiffDoc. Проблема в том, что мне трудно найти что-то, что будет делать то, что нам нужно. WinMerge была последней попыткой.

Проблема проста. Один документ Word и один документ PDF, часть которого содержит текст для сравнения.

Сравните их и все будет готово. Необработанный текст, игнорирование пробелов, игнорирование возвратов каретки и т. Д .; и дайте мне результаты в каком-то отчете.

Мы попробовали ExamDiff, kdiff3, Tortoise и несколько других.

2 ответа2

0

Вы можете попробовать изучить awk, sed и некоторые сценарии bash, чтобы помочь вам.

0

На данный момент моё решение - это приложение с мешаниной. PDFBox для извлечения PDF и Word Interop для документов Word. Он просматривает их, заменяет \r \n на "", помещает каждый из них в файл .txt, после чего они готовы для простого сравнения в WinMerge.

Хотелось бы что-то более надежное и официальное ... но сейчас ... это ответ бесплатно ...

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .