У меня есть несколько PDF-файлов, которые предназначены (в данном случае) для лазерной резки - поэтому в основном их единственным содержимым являются некоторые векторные линии / геометрия, нет растрового / растрового содержимого, нет текстового содержимого.

Оказывается, у этих PDF-файлов есть повторяющиеся векторы - например, у меня был бы прямоугольник с белым фоном, - а затем дополнительная линия для каждой из линий контура прямоугольника.

Так что, по сути, мне нужно избавиться от дублирующих строк - и я бы предпочел не импортировать этот PDF-файл в векторное приложение (Inkscape, LibreOffice Draw), потому что тогда они обязательно добавят некоторые другие элементы в PDF-файл и, возможно, изменят его. размер страницы и т. д.

Итак, мне было интересно - есть ли инструмент командной строки, который я мог бы использовать для проверки векторного содержимого PDF-файлов, как в этом псевдокоде:

$ some-pdf-tool --infile test.pdf --inspect-vectors
Opening "test.pdf" - 4 pages;
Page 1, size 100x30 mm:
- id:#1, line: 2 points [(0,0), (0,10)], outline color: #000000, thickness 1pt
- id:#2, line: 2 points [(0,10), (10,10)], outline color: #000000, thickness 1pt
- id:#3, line: 2 points [(10,10), (10,0)], outline color: #000000, thickness 1pt
- id:#4, line: 2 points [(10,0), (0,0)], outline color: #000000, thickness 1pt
- id:#5, polygon: 4 points [(0,0), (0,10), (10,10), (10,0)], outline color: #000000, thickness 1pt, fill: #FFFFFF

... а затем возможно отфильтровать в новый PDF, как в этом псевдокоде:

$ some-pdf-tool --infile test.pdf --filter-vector-ids=1,2,3,4 --outfile test_out.pdf

... что приведет к test_out.pdf котором присутствует только форма "id:# 5, многоугольник" (и другие строки удалены), и больше ничего не изменилось по сравнению с исходным входным test.pdf?

0