У меня есть текстовый файл в кодировке ASCII, где каждая строка имеет следующую структуру:
XYplorer nn.nn.nnnn [yyyy-mm-dd hh.mm.ss] [S256 S256].zip
↑↑ ↑↑ ↑↑↑↑ ↑↑↑↑ ↑↑ ↑↑ ↑↑ ↑↑ ↑↑ ↑64× ↑64×
поэтому длина строки составляет 177 символов, 27 символов не меняются, а остальные 150 изменяются, и эти два хэша составляют 128 таких символов. Я также предполагаю, что хеши в основном случайный текст, поэтому его трудно сжать, поэтому
27/177 = 15.3%
фиксированный текст
22/177 = 12.4%
изменение текста
128/177 = 72.3%
случайного текста
Тем не менее, архивируя такой файл (1854 строки) стандартным способом (правой кнопкой мыши) в Windows, я достигаю степени сжатия 49%, что сбивает меня с толку, потому что она кажется слишком высокой / эффективной.
Можете ли вы объяснить мне, как случайная часть может быть сжата так сильно?