У меня много PDF-файлов, и многие из них могут быть повреждены. Вместо того, чтобы проверять каждый из них, как я могу проверить их все сразу и удалить поврежденные?

Использование Linux. У меня также нет способа получить md5sum из книг, так что это не так.

Это можно сделать либо с помощью сценария оболочки, либо мне было бы интересно узнать, как написать C-программу для этого. Но опять же, моя главная проблема в том, что мне не с чем сравнивать md5sum.

2 ответа2

1

То, что вы ищете, это проверка формата файла. Возможно, JHOVE - JSTOR/ Гарвардская Среда Проверки Объектов была бы полезна.

1

Проект Multivalent включает инструмент проверки PDF, который, кажется, соответствует вашим требованиям.

утверждать

Исследует PDF-файлы на выбранном уровне детализации и сообщает об ошибках Быстро проверьте наличие недействительных или поврежденных PDF-файлов в вашем архиве или проверьте только что загруженную группу PDF-файлов.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .