Мы столкнулись с ситуацией, когда резервное копирование данных осуществлялось на несколько внешних носителей, и мы выполняем упражнение по консолидации данных. Данные состоят из двоичных файлов, аудио, видео, сжатых архивов, виртуальных машин, баз данных и т.д.
Рекомендуется ли копировать все файлы в один источник до дедупликации данных, или это нормально для выполнения процедуры на нескольких носителях?
Лучше ли запускать дедупликацию на уровне файлов или на уровне блоков? Я знаю о технических различиях, но неясно, почему вы бы предпочли одно другому. Мы за точность в отличие от производительности
РЕДАКТИРОВАТЬ
Когда я говорю «копировать», я имею в виду, что мы будем копировать каждый источник на один диск или NAS. Каждый источник будет представлен каталогом. Все данные в настоящее время хранятся на внешних жестких дисках. Цель состоит в том, чтобы дедуплицировать данные и иметь единый источник правды.