У меня есть архив событий crontab в какую-то папку .tar.gz каждые N часов. Наконец у меня есть коллекция файлов .tar.gz . Теперь я хочу удалить дублирующиеся архивы (созданные, пока целевые файлы остаются без изменений). Как это сделать.

Я попытался выполнить сравнение, проверив hashsum, но архивы tar.gz всегда имеют различную сумму:

altera@nuclight:~$ rm -rf *
altera@nuclight:~$ echo "Hello world" > file
altera@nuclight:~$ tar czf a1.tgz file
altera@nuclight:~$ tar czf a2.tgz file
altera@nuclight:~$ tar czf a3.tgz file
altera@nuclight:~$ tar czf a4.tgz file
altera@nuclight:~$ tar czf a5.tgz file
altera@nuclight:~$ ls
a1.tgz  a2.tgz  a3.tgz  a4.tgz  a5.tgz  file
altera@nuclight:~$ md5sum *.tgz
e8587f4c381856af9278a6ef2a452b00  a1.tgz
2f44617fb164e66a74c5c4992637e7d4  a2.tgz
1a094b315e2d0891a0c5dafebae9718f  a3.tgz
6c3642d2441397c24e4de5377b9e0a7e  a4.tgz
7c0e9128ef47a9dbcda0dd008e34cd8d  a5.tgz
altera@nuclight:~$

1 ответ1

0

Если ваши исходные файлы совершенно нетронуты, запуск хеш / контрольной суммы в ваших архивах должен дать те же результаты для неизмененных файлов. Затем просто удалите файлы с дублирующимися хэшами.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .