Мы столкнулись с ситуацией, когда резервное копирование данных осуществлялось на несколько внешних носителей, и мы выполняем упражнение по консолидации данных. Данные состоят из двоичных файлов, аудио, видео, сжатых архивов, виртуальных машин, баз данных и т.д.

  1. Рекомендуется ли копировать все файлы в один источник до дедупликации данных, или это нормально для выполнения процедуры на нескольких носителях?

  2. Лучше ли запускать дедупликацию на уровне файлов или на уровне блоков? Я знаю о технических различиях, но неясно, почему вы бы предпочли одно другому. Мы за точность в отличие от производительности

РЕДАКТИРОВАТЬ

Когда я говорю «копировать», я имею в виду, что мы будем копировать каждый источник на один диск или NAS. Каждый источник будет представлен каталогом. Все данные в настоящее время хранятся на внешних жестких дисках. Цель состоит в том, чтобы дедуплицировать данные и иметь единый источник правды.

1 ответ1

0

Такие инструменты, как rsync, могут управлять операциями сравнения и перемещения битов назад и вперед, но вам нужно будет предоставить свою собственную логику о том, какая версия данных является канонической.

Лучше ли запускать дедупликацию на уровне файлов или на уровне блоков?

По крайней мере, эта часть вашего вопроса проста: вам никогда не нужно заботиться о том, что происходит на уровне блоков.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .