Я беру ночное резервное копирование с моего сервиса веб-хостинга как .tar.gz. Данные меняются очень мало каждую ночь (<10 МБ).
Я хотел бы заархивировать эти файлы и дедуплицировать (сплошное сжатие) файлы в нескольких архивах .tar.gz без извлечения каждого отдельного файла резервной копии.
Упрощенный пример:
2013-02-24.tar.gz содержит a.pdf 2013-02-25.tar.gz содержит a.pdf и b.pdf
Я хочу сжать и архивировать 2013-02-24.tar.gz и 2013-02-25.tar.gz и хранить a.pdf только один раз.
Единственный способ получить дедупликацию - распаковать оба .tar.gz и снова упаковать их (используя сплошное сжатие). Но это еще один дополнительный шаг, и он, вероятно, сотрет информацию о файловой системе из-за разных ОС. Просто tar/gz оба файла .tar.gz не будут работать, окончательный размер этого архива будет суммой обоих оригинальных файлов .tar.gz.
Есть ли способ использовать дедупликацию для содержимого нескольких файлов .tar.gz?
