Мой университет требует, чтобы представленные файлы PDF были в формате PDF/A.
Я пытался найти конвертер, но все они очень дорогие и / или сложные.
Как я могу преобразовать свой существующий файл PDF в PDF/A?
Большое спасибо!
Мой университет требует, чтобы представленные файлы PDF были в формате PDF/A.
Я пытался найти конвертер, но все они очень дорогие и / или сложные.
Как я могу преобразовать свой существующий файл PDF в PDF/A?
Большое спасибо!
PDF /A является международным стандартом ISO за rchiving PDF - файлов. Стандарт требует строгого соответствия своему набору правил (например, "вставлять все шрифты", "не использовать прозрачные пленки", "не использовать JavaScript", "не использовать шифрование", ...).
Существует множество PDF-файлов, которые утверждают, что являются PDF/A, но не прошли настоящий тест на дым. Это утверждение является просто тегом в метаданных файла. Этот тег может сделать Fe Acrobat Reader отображает особую подсказку при рендеринге.
Проверка на подлинное соответствие требует некоторого довольно обширного коммерческого "предполетного" программного обеспечения. В настоящее время я не знаю ни одной бесплатной утилиты для этой работы. Смотрите также здесь для некоторых результатов испытаний: Isartor testsuite.
Вы можете использовать Ghostscript для (попытки) конвертировать PDF в PDF/A. Как это сделать, описано здесь (Обновление: для более новых версий здесь).
Но обратите внимание: этот документ был обновлен совсем недавно [ * ]. В предыдущих версиях Ghostscript Ps2pdf.htm пользователи вводили в заблуждение команду, которая создавала PDF-файлы, претендующие на звание PDF/A, но не прошедшие реальные тесты на дым.
Вот командная строка:
gswin32c ^
-dPDFA ^
-dNOOUTERSAVE ^
-dUseCIEColor ^
-sProcessColorModel=DeviceCMYK ^
-sDEVICE=pdfwrite ^
-o output_pdfa.pdf ^
-dPDFACompatibilityPolicy=1 ^
PDFA_def.ps ^
input.pdf
[ * ] Примечание . Проблема заключается в параметре PDFA_def.ps
. Это файл, который вам нужно отредактировать для соответствия вашим потребностям. Ghostscript поставляется с образцом в подкаталоге /lib
. Этот образец не будет работать как есть без редактирования. Как редактировать это в комментариях к образцу.
Я использовал следующую команду для преобразования PDF в PDF-A:
gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf PDFOriginal.ps
Если у вас есть файл PDF, сначала преобразуйте его в PS для работы с приведенным выше кодом. Я несколько раз пытался с PDF-файлом быть непосредственно преобразованным в PDF-A. Однако это не сработало.
Вот способ конвертировать ваш PDF в PS файл:
pdftops PDFOriginal.pdf PDFOriginal.ps
Для сохранения существующих документов Word в PDF/A вам нужна только последняя версия Microsoft Word. Для создания из других продуктов, которые печатают, вы можете использовать бесплатный PDF/A создатель, как на www.freepdfcreator.org
Если вам необходимо подтвердить, что файл PDF/A соответствует стандарту, вы можете воспользоваться нашим бесплатным сервисом по адресу www.validatepdfa.com.
Преобразование существующих PDF-файлов в PDF/A без потерь немного сложнее и не всегда возможно. Acrobat 9 и 10 могут сделать это. Наш бизнес, Solid Documents, также продает продукт, который делает это (и другие общие функции архивирования) за 99 долларов:Solid PDF Tools
Инструмент « Сохранить как PDF » в Microsoft Office 2007 сохраняет в формате PDF/A.
Документ PDF/A - это просто документ PDF, в котором используется определенное подмножество PDF, разработанное для обеспечения его «автономности». Т.е. нельзя полагаться на информацию из внешних источников (например, программы шрифтов и гиперссылки). Из википедии:
Другие ключевые элементы для совместимости PDF/A включают в себя:
* Audio and video content are forbidden. * JavaScript and executable file launches are forbidden. * All fonts must be embedded and also must be legally embeddable for unlimited, universal rendering. This also applies to the so-called PostScript standard fonts such as Times or Helvetica. * Colorspaces specified in a device-independent manner. * Encryption is disallowed. * Use of standards-based metadata is mandated.
Редактировать:
Поскольку на самом деле не существует никаких инструментов для проверки того, является ли PDF PDF/A, безопасная ставка, как и вы, ваш университет также не имеет возможности проверить, что отправленный им документ - PDF/A.
Вероятно, единственная причина, по которой они специально просят об этом, заключается в том, что они могут быть уверены, что весь контент будет "там", когда они его откроют. Они просто довольно загадочно (и плохо) выразили это требование как то, что оно должно быть PDF/A. Таким образом, простой способ проверить, соответствует ли PDF-документ их истинному требованию автономности, - это передать PDF-файл и просмотреть его с другого (предпочтительно автономного) компьютера и убедиться, что все выглядит так, как должно.
В macOSX без использования pdftops
которые я не смог установить (как предложил @ soham.m17), вы можете сделать:
pdf2ps oldPdf.pdf psVersionOfOldps.ps
конвертировать ваш PDF в формат PS, а затем:
gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf psVersionOfOldps.ps
конвертировать в pdf/A.
Единственный способ, который работал для меня в Windows 10, - это небольшая модификация ответа Сохама (который работал для меня, но с ошибками):
PDF
в ps
(с pdf2ps source.pdf temp.ps
)ps
обратно в PDF/A
с использованием Ghostscript 9.22 сgswin64c -dPDFA -dBATCH -dNOPAUSE -dPDFSETTINGS=/prepress -dNOOUTERSAVE -sColorConversionStrategy=UseDeviceIndependentColor -sProcessColorModel=DeviceRGB -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=destination.pdf temp.ps
(Возможно, вам придется добавить перед gswin64c
полный путь, который для меня был C:\Program Files\gs\gs9.22\bin\
- то же самое для pdf2ps
, в этом случае путь для меня был C:\Program Files\gs\gs9.22\lib\
)
Если полученный файл слишком велик, вы можете опустить -dPDFSETTINGS=/prepress
. Без этой опции результирующий файл будет меньше (даже меньше, чем оригинал в моем случае), но можно заметить ухудшение качества изображения.
Получившийся PDF
похоже, соответствует PDF/A
даже без опции -dNOOUTERSAVE
, хотя встроено меньше шрифтов (возможно, кто-то может объяснить разницу).
Когда я говорю «соответствует PDF/A
», я имею в виду не только то, что "баннер" PDF/A
отображается в Acrobat Reader, но и то, что файл проходит онлайн-проверку, предоставленную https://www.pdf-online.com/osa. /validate.aspx
Я не знаю, насколько надежна такая онлайновая служба проверки, однако ей удалось обнаружить несоответствующие файлы, которые отображали PDF/A
баннер в Acrobat Reader (что, следовательно, не кажется надежным в этом отношении).