-1

Предположим, у вас есть файловая иерархия с миллионами файлов (может быть резервной копией).

Как описано в https://askubuntu.com/questions/318530/generate-md5-checksum-for-all-files-in-a-directory, можно использовать любую из следующих команд для создания файла «checklist.chk» с хэш-код и имя в каждой строке:

md5sum * > checklist.chk        # Doesn't go down sub directories
# or
find -type f -exec md5sum "{}" + > checklist.chk   # Do go down sub directories

Затем для проверки файлов вы можете использовать:

md5sum -c checklist.chk

Теперь предположим, что вы изменили только несколько из этих миллионов файлов (возможно, потому, что вы использовали rsync). Затем он считает ненужным пересчитать все хеш-коды.

Я искал что-то (программу, скрипт или что-то еще), которое использует файл "checklist.chk" с четырьмя столбцами: хэш-код, дата изменения, размер и имя в каждой строке. И так же, как rsync, он пропускает файлы, в которых размер / дата изменения не изменилась.

Затем, в дальнейшем, вы, конечно, должны на самом деле проверить целостность файлов, вызвав что-то, соответствующее '' 'md5sum -c checklist.chk' ''.

Или есть лучшие способы решить всю эту проблему.

1 ответ1

0

Поэтому я написал свою собственную программу: https://github.com/emandersson/hashcodefilesync, которая выполняет все вышеперечисленное (ускоряет обновление хеш-файла).

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .