Я беру ночное резервное копирование с моего сервиса веб-хостинга как .tar.gz. Данные меняются очень мало каждую ночь (<10 МБ).
Я хотел бы заархивировать эти файлы и дедуплицировать (сплошное сжатие) файлы в нескольких архивах .tar.gz без извлечения каждого отдельного файла резервной копии.
Упрощенный пример:
2013-02-24.tar.gz
содержит a.pdf
2013-02-25.tar.gz
содержит a.pdf
и b.pdf
Я хочу сжать и архивировать 2013-02-24.tar.gz
и 2013-02-25.tar.gz
и хранить a.pdf
только один раз.
Единственный способ получить дедупликацию - распаковать оба .tar.gz и снова упаковать их (используя сплошное сжатие). Но это еще один дополнительный шаг, и он, вероятно, сотрет информацию о файловой системе из-за разных ОС. Просто tar/gz оба файла .tar.gz не будут работать, окончательный размер этого архива будет суммой обоих оригинальных файлов .tar.gz.
Есть ли способ использовать дедупликацию для содержимого нескольких файлов .tar.gz?