7

У меня есть PDF-файл с текстом на каждой странице, который я хотел бы удалить.

Текст соответствует регулярному выражению, и я думаю, что он входит в один блок PDF.

Я использовал pdfedit для выбора и удаления текста с помощью графического интерфейса, но я искал способ сделать это из терминала.

2 ответа2

6

Вы можете попробовать pdftk, но он работает только часть времени из-за (я считаю) проблемы со шрифтами.

Это работает так: сначала нужно распаковать файл pdf,

  pdftk myfile.pdf output unc.pdf uncompress

затем вы модифицируете его

  sed 's/oldstring/newstring/g' < unc.pdf > mod_unc.pdf

наконец, вы сжимаете его

 pdftk mod_unc.pdf output myfile_modified.pdf compress

У меня был только умеренный успех с этой командой, в том смысле, что иногда она работает, иногда нет, в соответствии с ее прихотью.

-3

Вы можете использовать любые редакторы PDF. Nitro PDF - хороший инструмент для редактирования PDF. Есть также так много бесплатных инструментов. Вы можете добавить или удалить текст, используя это.

http://www.nitropdf.com/free-pdf-software

PDFEdit - хороший вариант для Linux. Прочтите эту ссылку, чтобы узнать, как установить. cyberciti.biz/tips/open-source-linux-pdf-writer.html

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .