Эти преобразования будут варьироваться в зависимости от типа файла. Изображение будет хранить метаданные иначе, чем документ, который будет хранить метаданные иначе, чем видео. Даже разные типы файлов схожих вещей (например, BMP и JPG) хранят свои метаданные по-разному.
Таким образом, вам понадобятся уникальные приложения для каждого из них.
Для изображений вы должны иметь возможность использовать IrfanView, который будет удобен, потому что он может легко обрабатывать большое количество файлов.
Для документов MS Office имеет определенные возможности или процессы, как определено MS, как минимизировать метаданные, включенные в документы. К сожалению, документация MS в основном касается старых версий.
Для версий 2003 существует инструмент MS для удаления метаданных: http://support.microsoft.com/default.aspx?kbid=834427
Для версий до 2003 года MS имеет документы о том, как удалить эту информацию: http://office.microsoft.com/en-us/excel-help/find-and-remove-metadata-hidden-information-in-your-legal -documents-HA001077646.aspx
Для новых версий офиса у Payne Consulting Group есть уборщик (я работал в крупной юридической фирме, которая использовала это для Office 2010), но я думаю, что это ужасно дорого. Существует также iScrub и другое чистящее средство, описанное в статье Tech Republic: http://www.techrepublic.com/article/keep-microsoft-office-documents-clean-with-iscrub/5035132
Я нашел статью MS о проверке и очистке документов без использования каких-либо других инструментов. Это руководство, но оно уже включено в продукты MS, и решение работает в версии 2010: http://office.microsoft.com/en-us/word-help/remove-hidden-data-and-personal-information- по-инспектирующим-документы-HA010354329.aspx