Я постоянно передаю образы дисков и образы виртуальных машин (обычно от 800 ГБ до почти 1 ТБ на файл) на облачный сервер через rclone с использованием SSH, и мне интересно, насколько надежны sha1sum и md5sum, когда дело доходит до проверки целостности очень больших файлов.
Я нашел это:Как я могу проверить, что файл 1TB передан правильно?
Однако это имеет отношение к производительности, а не к надежности генерируемых хэшей.
Может ли быть вероятность того, что другой файл будет использовать те же хеши, сгенерированные с учетом того, что существует так много разных файлов?
Итак, насколько надежны суммы MD5 и SHA-1 для очень больших файлов? Благодарю.
Я также выяснил это в отношении столкновения:https://stackoverflow.com/questions/4032209/is-md5-still-good-enough-to-uniquely-identify-files
https://www.theregister.co.uk/2017/02/23/google_first_sha1_collision/