9

Как избыточность реализована в архивировании, и как я могу извлечь из этого выгоду?

Я бы предположил, что он состоит из чего-то вроде хранения таблиц подстановки дважды, так что один дефект не делает недействительным весь остальной файл. Что касается варианта использования, возможно, при сохранении файла на компакт-диске, который получает небольшую царапину?

Однако я лично никогда не получал никакой прибыли от добавления избыточности к zip-файлам, и я склонен их опускать, поэтому мне было интересно, действительно ли они полезны на практике.

1 ответ1

1

Я полагаю, вы говорите об адаптивном алгоритме LZ. Это не называется избыточностью из-за того, что что-то дублируется в процессе создания zip-файла. Термин происходит от того, как работает этот метод сжатия.

Чтобы проиллюстрировать, вот пример. Допустим, у меня был документ, содержащий фразу:

It is what it is because that's what it is

Если бы я хотел сократить эту фразу за счет избыточности, я бы сначала сделал словарь, содержащий все слова, которые были повторены, вот так

1it
2is
3what

И тогда я бы переписал предложение как

12312becausethats312 

Если я затем захочу сжать его дальше, я могу добавить следующее в свой словарь:

312x
12y

Так что становится

yxbecausethatsx

Как видите, чем больше проверок на избыточность вы пройдете, тем больше будет сжатие. Но вы также увеличиваете вероятность коррупции. Это связано с тем, что по мере роста словаря он становится более подверженным повреждениям, и если какая-либо часть словаря повреждена, остальная часть не может быть прочитана.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .