У меня есть несколько каталогов, содержащих тысячи файлов gzip (в целом речь идет о файлах 1M). Некоторые из этих файлов повреждены, и большинство из них действительно маленькие (пара КБ).
Почти все они очень похожи по содержанию, поэтому сжатие всех вместе должно улучшить степень сжатия по сравнению с текущей ситуацией.
Поскольку я редко просматриваю эти каталоги и мне просто нужно иметь их по архивным причинам, мне нужен высокодоступный формат с высокой степенью сжатия и создание единого архива. Было бы неплохо иметь возможность произвольного доступа для доступа к определенным файлам время от времени без распаковки всего архива.
Какова лучшая стратегия здесь? Тар устойчив к коррупции? Я бы предпочел что-то, что может быть реализовано в виде однострочного или простого скрипта bash.