2

Как можно посчитать количество строк в файле PDF? Желательно из командной строки linux (bash)?

pdf файлы, которые я хочу проанализировать, генерируются с использованием LaTeX, поэтому любое решение, работающее с исходными текстами, также подойдет (при условии, что результаты такие же, как при подсчете в pdf вручную, а полученный pdf не изменяется).

1 ответ1

4

Вы можете попробовать использовать pdftotext

pdftotext -layout file.pdf - | wc -l

Опция -layout может не понадобиться. Я бы сказал, что некоторые эксперименты в порядке.

Вы также можете использовать wc непосредственно для исходных текстов, но это, вероятно, не даст того же результата, что и при измерении PDF-файлов, поскольку текстовые файлы будут содержать строки, которые не будут видны в конечном PDF-файле.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .