Это абстрактный вопрос для меня, надеюсь, кто-то может направить меня в одну полосу.
Я хочу проанализировать содержимое файла и узнать информацию, как показано ниже:
Подходят ли данные файла для дедупликации? или это слишком грязно для дедупликации?
Был ли он атакован атакой вымогателей?
Могу ли я распознать формат, не анализируя расширение файла?
Может быть, я не могу найти один инструмент, чтобы сделать все выше, но я хочу знать, могут ли какие-либо инструменты (такие как python, C или еще) могут выполнять функцию, подобную анализу?
Я надеюсь, что кто-нибудь даст мне ключ, чтобы найти информацию об этом. Спасибо