1

У меня много фотографий, организованных в папки. У меня также есть папка "Без рубрики" для фотографий до их организации. Я обнаружил, что многие (но не все) фотографии в Без рубрики теперь упорядочены, но не удалены из Без рубрики.

Я хотел бы, через командную строку или другим способом, найти все файлы в Без рубрики, которые дублируются в других папках (так что я знаю, какие из них безопасно удалить). В идеале решение будет использовать MD5 (или аналогичный) для обеспечения истинного дублирования. Тем не менее, имя файла - только хорошее начало.

Может кто-нибудь дать подсказку, как это сделать в командной строке? Или в качестве альтернативы предложить какое-нибудь программное обеспечение, которое может помочь?

Спасибо!

1 ответ1

2

Ты можешь использовать:

find -not -empty -type f -printf "%s\n" | sort -rn | uniq -d | xargs -I{} -n1 find -type f -size {}c -print0 | xargs -0 md5sum | sort | uniq -w32 --all-repeated=separate

(замените md5sum на sha512sum, чтобы избежать коллизий)

или инструмент "lint", такой как fslint, fdupes

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .