Существует ли программа или служба, которая принимает файлы PDF и автоматически перечисляет абзацы? Я сделал несколько простых поисков в Google и не смог найти ничего легкодоступного.
1 ответ
Под "перечислением абзацев" я думаю, что вы имеете в виду создание нового PDF-файла с номерами, вставленными перед каждым абзацем, и текстом, переформатированным для размещения этого и любых других объектов (например, изображений), перемещаемых по мере необходимости, и повторной разбивки документа.
PDF был задуман как форма документа в окончательном формате, поэтому он не облегчает дальнейшие манипуляции с его содержимым.
В частности, вы не можете гарантировать, что внутренняя организация PDF включает какую-либо концепцию абзацев или даже слов. Вы даже не можете гарантировать, что символы закодированы в любой обычной кодировке - что может затруднить разграничение знаков препинания и букв.
Существуют программные библиотеки для чтения PDF-файлов, поэтому вы можете, в принципе, попытаться написать такую программу. Это может быть сделано для работы с PDF-файлами, созданными одним конкретным рабочим процессом с использованием определенных продуктов. В целом, хотя это может работать хуже, чем преобразование PDF в изображение и использование оптического распознавания текста на изображении.
Этот тип вопроса («Есть ли программа, которая ...») может лучше подходить для Рекомендаций по программному обеспечению, но я был бы удивлен, если что-то существует, что вы можете сразу же использовать для произвольных PDF-файлов.