Я ищу утилиту (для Linux или Windows), которая может проверить, что содержимое файла, кажется, соответствует расширению. Это для ловли сильно поврежденных файлов.
Я нахожусь на грани написания небольшого bash-скрипта, который будет запускать "file" для всего, но я не хочу выяснять, что "file" возвращает для всех правильно отформатированных типов файлов, которые я собираюсь встретиться.
Предыстория: друг недавно случайно удалил свою папку пользователя Windows (да ... Рабочий стол, реестр, My Docs, все это ...). Я использовал агрессивную утилиту восстановления, чтобы восстановить как можно больше. Эта конкретная утилита по какой-то причине восстанавливает несколько копий одного и того же файла (например, «Letter.doc», «Letter (1).doc», «Letter (2).doc» и т.д.). Некоторые из этих файлов будут содержать случайный мусор, некоторые будут действительным документом, и, возможно, один и тот же документ.
Итак, я использовал fdupes и perl-скрипт для уничтожения всех дубликатов, но теперь я хочу отделить те, которые выглядят так, как будто они могут быть исходным файлом, от тех, которые, вероятно, нет. Я не могу поверить, что я первый человек, который должен сделать это ...