У меня есть 2 старых похожих дерева каталогов с файлами MP3 в них. Я с радостью использую такие инструменты, как diff и Rsync, чтобы идентифицировать и объединять файлы, которые присутствуют только на одной стороне или идентичны, у меня осталась куча файлов, которые по-разному отличаются.
При запуске diff над парой фактически разных файлов (с тегом -a для принудительного анализа текста) получается непонятный бред. Я слушал файлы с обеих сторон, и они оба, кажется, играют хорошо (но почти по 10 минут на песню, при прослушивании их по два раза, я не сделал много)
Я подозреваю, что различия связаны с тем, что некоторые игроки в прошлом "улучшали" мою коллекцию, возиться с тэгами ID3, но я не уверен. Даже если я укажу различия в тегах ID3, я хотел бы подтвердить, что никакие проблемы с копированием космических лучей или файлов не повредили ни один из файлов.
Один метод, который оказывается, состоит в том, чтобы находить местоположения байтов различий и игнорировать все изменения в первых ~ 10 КБ каждого файла, но я не знаю, как это сделать.
У меня порядка сотни файлов, которые различаются по дереву каталогов.
Я нашел Как сравнить mp3, аудио данные flac в файле, игнорируя данные заголовка (тег ID3) и т.д.? - но я не могу запустить alldup из-за того, что я только Linux, и, судя по всему, это все равно только частично решит мои проблемы.