Мой дядя - фотограф с большим количеством фотосессий. Он хранил (дублирует) резервные копии на различных внешних жестких дисках. 90% всех резервных копий одинаковы, но некоторые имеют некоторые изменения, такие как добавленные файлы или фотографии с фотошопом. Теперь я получил ему NAS с настройкой RAID и внешнее NAS для дополнительного резервного копирования основного компьютера, чтобы хранить все его данные на одном устройстве. Он попросил меня дедуплицировать все резервные копии и сохранить только последнюю версию, удалив все копии.
Уже есть несколько приложений (конечно, рекомендуем одно, если вы знаете одно (Mac/Windows) для идентификации копируемых изображений, когда размер файла и имя файла совпадают. Но мне было интересно ..
TL; DR
Каковы шансы на то, что изображение сохранит тот же размер файла, когда оно будет готово?
//
В качестве альтернативы: Как лучше всего определить идеальные дубликаты изображений?
В случае, если мой предыдущий метод работы (имя файла / размер) не лучший способ пойти на это.
У меня было предположение, что если шансы очень низкие (<1%), я мог бы просто искать и уничтожать и сохранять 1 из каждого файла, у которого и имя, и размер файла равны.