В настоящее время я работаю летним стажером.
Моя первая задача, учитывая набор файлов, восстановить и определить типы файлов, присутствующие в нем.
Для загрузки образцов псевдо-криминалистических данных я использовал: Digital Corpora
Для восстановления файлов я использовал « Sleuthkit », но это, похоже, не работает, так как я всегда получаю сообщения об ошибках, касающиеся формата используемых данных.
Было бы здорово получить предложения / ссылки на учебники или программное обеспечение, которые помогают в восстановлении данных.
Я также с нетерпением жду ссылок для загрузки данных судебно-медицинской экспертизы psuedo, аналогичных приведенным выше.
В частности, я хотел бы восстановить все данные в текстовых форматах (word, pdf, emails, html ... и т.д.), Затем объединить их в один файл в текстовом формате и затем использовать обработку на естественном языке, чтобы определить места, с которыми был связан человек. с. У меня есть некоторые идеи относительно аспекта проблемы обработки на естественном языке, но мне нужна помощь в восстановлении данных. Как лучше всего выполнить эту задачу.