1

Существует ли программа или служба, которая принимает файлы PDF и автоматически перечисляет абзацы? Я сделал несколько простых поисков в Google и не смог найти ничего легкодоступного.

1 ответ1

1

Под "перечислением абзацев" я думаю, что вы имеете в виду создание нового PDF-файла с номерами, вставленными перед каждым абзацем, и текстом, переформатированным для размещения этого и любых других объектов (например, изображений), перемещаемых по мере необходимости, и повторной разбивки документа.

PDF был задуман как форма документа в окончательном формате, поэтому он не облегчает дальнейшие манипуляции с его содержимым.

В частности, вы не можете гарантировать, что внутренняя организация PDF включает какую-либо концепцию абзацев или даже слов. Вы даже не можете гарантировать, что символы закодированы в любой обычной кодировке - что может затруднить разграничение знаков препинания и букв.

Существуют программные библиотеки для чтения PDF-файлов, поэтому вы можете, в принципе, попытаться написать такую программу. Это может быть сделано для работы с PDF-файлами, созданными одним конкретным рабочим процессом с использованием определенных продуктов. В целом, хотя это может работать хуже, чем преобразование PDF в изображение и использование оптического распознавания текста на изображении.

Этот тип вопроса («Есть ли программа, которая ...») может лучше подходить для Рекомендаций по программному обеспечению, но я был бы удивлен, если что-то существует, что вы можете сразу же использовать для произвольных PDF-файлов.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .