У меня проблемы с чтением PDF на моем Kindle, потому что текст OCR отображается в двух столбцах на странице. (Т.е. книга была отсканирована по две страницы за раз, они были распознаны). Как я могу отформатировать это в один столбец (или любой другой стиль), чтобы я мог прочитать его на своем Kindle?

2 ответа2

5

В последней версии k2pdfopt можно либо сохранить OCR с собственным параметром вывода PDF (-mode 2col), либо восстановить OCR с помощью собственного OCR. Кроме того, запуск вывода k2pdfopt через Caliber, как некоторые предположили, не является необходимым, если вы используете правильные настройки в k2pdfopt.

Редактировать: v2.x из k2pdfopt, выпущенный 3 сентября 2013 года, по умолчанию сохранит ранее распознанный текст, даже если он не используется в режиме вывода собственного PDF (например, при перетекании текста).

1

Нашел это руководство. В основном используется k2pdfopt для преобразования двух столбцов в один. А затем запустить это через Caliber для более чистой версии.

Это частичное решение, поскольку оно устраняет преимущества OCR. В результате файл только изображения и, следовательно, очень большой.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .