Предположим, у вас есть файловая иерархия с миллионами файлов (может быть резервной копией).
Как описано в https://askubuntu.com/questions/318530/generate-md5-checksum-for-all-files-in-a-directory, можно использовать любую из следующих команд для создания файла «checklist.chk» с хэш-код и имя в каждой строке:
md5sum * > checklist.chk # Doesn't go down sub directories
# or
find -type f -exec md5sum "{}" + > checklist.chk # Do go down sub directories
Затем для проверки файлов вы можете использовать:
md5sum -c checklist.chk
Теперь предположим, что вы изменили только несколько из этих миллионов файлов (возможно, потому, что вы использовали rsync). Затем он считает ненужным пересчитать все хеш-коды.
Я искал что-то (программу, скрипт или что-то еще), которое использует файл "checklist.chk" с четырьмя столбцами: хэш-код, дата изменения, размер и имя в каждой строке. И так же, как rsync, он пропускает файлы, в которых размер / дата изменения не изменилась.
Затем, в дальнейшем, вы, конечно, должны на самом деле проверить целостность файлов, вызвав что-то, соответствующее '' 'md5sum -c checklist.chk' ''.
Или есть лучшие способы решить всю эту проблему.