1

Я ищу, можно ли без потерь воссоздать исходное содержимое текстового файла только из сохраненного значения хеша (я предпочитаю алгоритм контрольной суммы CRC вместо других, потому что его занимаемая площадь действительно мала, хотя его можно считать ПЛОХОЙ для больших входных данных),

В частности, у меня есть один текстовый файл, состоящий из 16 символов из алфавита:

AD
DE
CB
ME
AE
PA
EB
AB
CN
NO
CE
MD
CK
GI
CL
GL
LE
CA
PH
GE
HB
CL
DE
CA
LF
CK
KD
CB
AB
BJ
JA
KE
KL
GI
HM
CI
DB
DE
AJ
FC

Цель: восстановить исходное содержимое файла без потерь только из хеш-значений CRC

Мои вопросы:

  1. Если у вас есть достаточно маленький и конечный набор файлов, которые по совпадению имеют уникальные хеши, то да, вы можете извлечь файл из хеша, используя хеш в качестве ключа.

    1.1 - Небольшой ввод - каков предел общего количества символов в текстовом файле, когда алгоритм хеширования все еще считает файл хорошим с точки зрения создания хеш-коллизий?

    PS Конечно, разделитель (в данном случае символ новой строки) может быть удален, поскольку существует только два значения (одна пара), но это пока не имеет значения. Следовательно, он может быть смешан вместе, но в то же время он должен быть соответствующим образом спарен - то есть "ADDECBME"

  2. Чтобы гарантировать, что коллизии хеша не возникнут для вашей "библиотеки" файлов, вы можете зарезервировать "область нуля" (разрыв где-то) для разрыва связей и заполнить ее произвольными значениями, которые создают новый уникальный ключ для всего файла. , который сейчас изменился.

    2.1. "Область царапин" - можно ли ее определить в виде новых папок? Я имею в виду: там будут папки из 1-2000 со многими сгенерированными файлами для сравнения контрольной суммы CRC.

    Или это должно быть отделено намного лучше, например, стратегия поврежденных файлов? Поврежденные файлы всегда дают значение CRC 00000000 (я знаю это из WinRAR), так что ... или 1-й подход лучше?

  3. Что касается генерации файлов, файлы будут генерироваться случайным образом в соответствии с заданной спецификацией, поскольку они вообще не содержат шаблон для отслеживания. Есть идеи получше? Помните, что я хочу сохранить только значения CRC, не более того.

Время не важно, конечно.

Не могли бы вы помочь мне?

0