Сценарий ниже найдет все файлы .docx
и .rtf
в текущем каталоге и переименует их в first_few_words.rtf
или docx
. Сначала вам нужно установить catdoc
. На Debian и его производных вы можете сделать это с
sudo apt-get install catdoc
Как ни странно, catdoc
выдает мне ошибку , когда я пробую ее на моем docx
, так что вместо этого используйте docx2txt
для файлов doc:
sudo apt-get install docx2txt
После установки catdoc
и docx
cd
в каталог, содержащий ваши файлы, и запустите:
for file in *rtf; do
name=$(catdoc "$file" | grep . | head -1 | sed 's/ /_/g') &&
mv "$file" "$name".rtf;
done
for file in *docx; do
name=$(docx2txt < "$file" | grep . | head -1 | sed 's/ /_/g') &&
mv "$file" "$name".docx;
done
ВНИМАНИЕ: Это приведет к удалению исходных файлов, сначала убедитесь, что вы сделали резервную копию, на всякий случай.
ОБЪЯСНЕНИЕ: обе утилиты преобразуют docx
или rtf
в текст, затем я выбираю первую непустую строку этого текста, преобразую пробелы в подчеркивания (это облегчит вашу жизнь в долгосрочной перспективе) и соответствующим образом переименовываю файлы.