1

У меня есть несколько PDF-файлов, которые я скачал с JStor. Они приходят с бесполезными числовыми именами файлов, но часто в метаданных есть хотя бы заголовок, если не автор.

Как пакетно переименовать несколько PDF-файлов, чтобы он выполнял поиск в метаданных и переименовывал файл «Author-Title», если в метаданных указаны "Author" и "Title"? Если что-то отсутствует, я бы хотел, чтобы он просто переименовал файл, чтобы отразить имеющиеся метаданные, назвав файл "Автор" или "Заголовок". Если метаданных нет, я бы не хотел ничего менять.

4 ответа4

2

Вот один из возможных способов, который предполагает написание сценария, который не должен быть слишком ужасным.

Используйте JHOVE для извлечения метаданных из файла и записи его в файл XML. Используйте выражение XPath, чтобы вытащить эти пути:

jhove/repInfo/ недвижимость / недвижимость / недвижимость / недвижимость / значение / значение

где три элемента свойства в пути содержат элементы <name>, значение которых равно "PDFMetadata", "Info" и "Title", чтобы получить заголовок, и «PDFMetadata," Info "и" Author ", чтобы получить автор. Затем вы можете использовать их программно для создания нового имени файла.

Это грубая схема, но я думаю, что идея может работать.

Полное раскрытие: я написал большую часть кода для JHOVE.

2

В OS X вы можете использовать mdls для запроса базы данных Spotlight о свойствах, которые она извлекает и индексирует для файла:

$ mdls -name kMDItemTitle A-Self-Referential-Story.pdf 
kMDItemTitle = "This Is the Title of This Story, Which Is Also Found Several Times in the Story Itself"
$ mdls -name kMDItemAuthors A-Self-Referential-Story.pdf 
kMDItemAuthors = (
    "David Moser"
)
1

Бесплатное программное обеспечение для библиографии, как

могу сделать это для вас.

  • Я предполагаю, что BibDesk (который не является независимым от платформы, но гораздо более похожим на Mac) также может сделать это.
0

Я только недавно создал приложение для пакетного переименования научных статей, очень полезное для переименования статей, чтобы сделать их более организованными с точки зрения имени файла.

Приложение работает путем получения заголовка из метаданных. Если нет метаданных, он будет разумно получить правильный заголовок из PDF. Затем к заголовку можно применить другой расширенный параметр, такой как сокращение до сокращения, добавление даты и т.д.

Демонстрационное видео:http://www.youtube.com/watch?feature=player_embedded&v=R01bvA9rhiQ

Можно загрузить в магазине приложений https://itunes.apple.com/app/pdf-paper-renamer/id591593578?mt=12.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .