Мой дядя - фотограф с большим количеством фотосессий. Он хранил (дублирует) резервные копии на различных внешних жестких дисках. 90% всех резервных копий одинаковы, но некоторые имеют некоторые изменения, такие как добавленные файлы или фотографии с фотошопом. Теперь я получил ему NAS с настройкой RAID и внешнее NAS для дополнительного резервного копирования основного компьютера, чтобы хранить все его данные на одном устройстве. Он попросил меня дедуплицировать все резервные копии и сохранить только последнюю версию, удалив все копии.

Уже есть несколько приложений (конечно, рекомендуем одно, если вы знаете одно (Mac/Windows) для идентификации копируемых изображений, когда размер файла и имя файла совпадают. Но мне было интересно ..


TL; DR
Каковы шансы на то, что изображение сохранит тот же размер файла, когда оно будет готово?

//

В качестве альтернативы: Как лучше всего определить идеальные дубликаты изображений?
В случае, если мой предыдущий метод работы (имя файла / размер) не лучший способ пойти на это.


У меня было предположение, что если шансы очень низкие (<1%), я мог бы просто искать и уничтожать и сохранять 1 из каждого файла, у которого и имя, и размер файла равны.

1 ответ1

1

Вы можете вычислить контрольные суммы на оригиналах / копиях и сравнить, чтобы увидеть, было ли что-нибудь изменено.

Эта ссылка объясняет это немного больше и предлагает некоторые инструменты, чтобы помочь.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .