У меня есть 120 000 файлов (на самом деле, гораздо больше; это просто произвольное подмножество) неизвестного типа. file
Linux не идентифицирует их (не обязательно, что они обязательно файлы Linux), равно как и другие методы, которые я пробовал. Есть только две подсказки о них, которые у меня есть на данный момент. Во-первых, я подозреваю, что используется некоторое сжатие - у меня есть метаданные, которые утверждают, что размеры файлов всегда на несколько больше, чем то, что я наблюдаю.
Другое дело, что в 100 000 из этих файлов первые 16 байтов всегда:
ff ee ee dd 00 00 00 00 01 00 00 00 00 00 00 00
Это действительно похоже на заголовок файла / магическое число для меня, но я просто не могу его разместить. Кто-нибудь знает, какие файлы это будет указывать? Кроме того, может ли кто-нибудь убедить меня, что эти подозрительно распространенные байты, безусловно, не указывают на конкретный тип файла?
ОБНОВИТЬ
Я не знаю точных деталей обратного проектирования, но большинство файлов в нашем случае - почтовые индексы после первых 29(? или около того) байты игнорируются. Таким образом, на практике проблема решена (мы знаем, как обрабатывать файлы), но в теории вопрос все еще остается без ответа - я не знаю, какое приложение обычно добавляет около 29 байтов к своим zip-файлам. [Я не уверен, должен ли я оставить вопрос открытым или нет на данном этапе.]