У меня есть каталоги с несколькими конфликтующими файлами, и я ищу способ сортировки, присвоения имен и удаления дубликатов, основанных на отдельном шаблоне, основанном на имени и размере файла. Хотя мои знания сценариев bash очень ограничены, поэтому я ищу какое-либо руководство по созданию этого.
- Дубликаты могут различаться по именам файлов и размеру файла
- Если есть дубликат, имя файла заканчивается на _conflict-yyyymmdd-hhmmss.ext
- Всегда есть нефиксированная версия файла, но она может быть повреждена
- Файл с наибольшим размером всегда правильный
- Несколько файлов могут иметь одинаковый размер, в этом случае удаление дубликатов и переименование файла является наиболее желательным
- Конечный файл всегда должен быть без префикса
Вот пример возможных сценариев:
FILE SIZE DESIRED ACTION
a. /path/to/dir1/FileName1.ext 0 rm
b. /path/to/dir1/FileName1_conflict-20130324-231953.ext 21624832 mv b a
c. /path/to/dir1/FileName1_conflict-20130326-080529.ext 21624832 rm
a. /path/to/dir2/FileName2.ext 25432935 -
b. /path/to/dir2/FileName2_conflict-20130324-092544.ext 0 rm
c. /path/to/dir2/FileName2_conflict-20130326-212307.ext 25432935 rm
a. /path/to/dir3/FileName3.ext 0 rm
b. /path/to/dir3/FileName3_conflict-20130324-214501.ext 23422234 mv b a
a. /path/to/dir4/FileName4.ext 0 rm
b. /path/to/dir4/FileName4_conflict-20130324-110541.ext 14423 rm
c. /path/to/dir4/FileName4_conflict-20130326-030512.ext 25432935 mv c a
Любая помощь и предложения с этим будет принята с благодарностью.
Обновление: решение
Очень жаль, что я не привел четких примеров того, что я пробовал, мои первые попытки были беспорядочными. Я не искал полноценный сценарий, просто помогу советом. Во всяком случае, я потратил день на изучение сценариев оболочки (это в значительной степени моя первая попытка), и я нашел решение, которое работает для меня. Вы можете найти мой скрипт ниже:
#!/bin/bash
# find all files without _conflict-suffix
find ./ -type f ! -name "*_conflict*" -print0 | while read -d $'\0' file
do
# regex to get dir and partial name
if [[ $file =~ ^(.*\/)(.*)(\..*)$ ]] ; then
dir="${BASH_REMATCH[1]}"
# file size in bytes
size=`wc -c < "$file"`
# look for matching files with _conflict-suffix
find "${dir}" -name "${BASH_REMATCH[2]}_conflict-*${BASH_REMATCH[3]}" -print0 | while read -d $'\0' conflict
do
# conflicting filesize in bytes
conSize=`wc -c < "$conflict"`
# check if conflict-file is bigger
if [[ $size -lt $conSize ]] ; then
# It is! Remove, rename, and update variable with new size
rm "${file}"
mv "${conflict}" "${file}"
set size=conSize
else
# It isn't, remove the trash.
rm "${conflict}"
fi
done
fi
done
Посмотрите на ответ @ NSD для другого решения.