Я отправил этот вопрос на днях: предложения о том, как восстановить поврежденные файлы

Файлы, которые я использовал в примере, были, возможно, не лучшими. Это все еще немного NSFW, но теперь у меня есть два файла, которые, как мне кажется, лучше понять, как решить эту проблему.

Архив двух файлов, одного хорошего и одного плохого, можно скачать здесь:http://dl.dropbox.com/u/340087/drops/05.20.11/testing-96acf4cc-033125.zip

Вот некоторые основные данные: (идентичные по размеру)

-rw-r--r--+  1 me  staff   1935797 May 26  2009 bad.JPG
-rw-r--r--+  1 me  staff   1935797 May 26  2009 good.JPG

MD5 действительно отличается:

MD5 (bad.JPG) = 313356d98ced569d573b9ded1555cf2b
MD5 (good.JPG) = e6178e88e92a79e97b6f9babe7dd8240

Если я зашифрую каждый файл, в плохом файле будет меньше данных, но я не уверен, можно ли его исправить. Возможно, отсутствуют только данные заголовка, и я могу добавить их обратно, возможно, существуют реальные данные, совершенно отличные от метаданных, что означает, что эти и подобные файлы полностью уничтожены.

Благодарю.

3 ответа3

5

Глядя на ваш ZIP файл рассказывает историю. good.jpg и bad.jpg имеют одинаковый размер файла, но bad.jpg сжимается с 1,84 МБ до 1,03 МБ, тогда как good.jgp практически не сжимается. Это указывает на то, что большая часть файла bad.jpg была перезаписана другими данными, которые легко сжимаются. Таким образом, большая часть данных изображения (квантованные и затем сжатые коэффициенты DCT) полностью не восстанавливаются, даже если вы можете восстановить информацию заголовка.

2

Вы можете использовать hex-редактор для просмотра необработанных двоичных данных в файлах. Вы также можете использовать разностный инструмент для просмотра различий между файлами.

В этом случае в bad.jpg отсутствуют первые 851 968 байт фотографии (они имеют значение NULL), поэтому нет возможности восстановить фотографию, хотя вы можете попытаться восстановить как можно большую ее часть. У Кельвина Хасса есть немного интересной информации о поврежденных фотографиях.


(И для записи, вы можете быть осторожны при публикации необработанных, неизмененных фотографий непосредственно с камеры в Интернет; данные Exif могут содержать некоторую информацию, которую вы, возможно, не захотите просочить - обычно это не проблема, но вы никогда не узнаете.)

0

на самом деле то, что вы сделали для сжатия двух файлов, уже показало различия между этими двумя файлами -

good.jpg сжимает на 1% (типично для изображения JPEG) Bad.jpg сжимает на 44% (не характерно для изображения JPEG)

таким образом, очень вероятно, что большинство данных были потеряны. (хорошо, по крайней мере, 44%)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .