Сценарий ниже найдет все файлы .docx и .rtf в текущем каталоге и переименует их в first_few_words.rtf или docx . Сначала вам нужно установить catdoc . На Debian и его производных вы можете сделать это с
sudo apt-get install catdoc
Как ни странно, catdoc выдает мне ошибку , когда я пробую ее на моем docx , так что вместо этого используйте docx2txt для файлов doc:
sudo apt-get install docx2txt
После установки catdoc и docx cd в каталог, содержащий ваши файлы, и запустите:
for file in *rtf; do
name=$(catdoc "$file" | grep . | head -1 | sed 's/ /_/g') &&
mv "$file" "$name".rtf;
done
for file in *docx; do
name=$(docx2txt < "$file" | grep . | head -1 | sed 's/ /_/g') &&
mv "$file" "$name".docx;
done
ВНИМАНИЕ: Это приведет к удалению исходных файлов, сначала убедитесь, что вы сделали резервную копию, на всякий случай.
ОБЪЯСНЕНИЕ: обе утилиты преобразуют docx или rtf в текст, затем я выбираю первую непустую строку этого текста, преобразую пробелы в подчеркивания (это облегчит вашу жизнь в долгосрочной перспективе) и соответствующим образом переименовываю файлы.