Я знаю, что подобные вопросы задавались ранее, но прежде чем пометить его как дубликат, позвольте мне объяснить.
Я только что купил .pdf
электронную книгу онлайн и хотел бы, чтобы она была .epub
. Я обычно использую calibre
(v1.0.0) для такого рода задач с большим успехом. На этот раз, кажется, что большие пропорции линий перепутались во время преобразования.
Jérôme disait aimer le rouge. Sa marotte
FRQVLVWDLW VXUWRXW ¡ O#HQOHYHU 'ªJUDIHU OD
dentelle était un geste qu'il effectuait avec la
Даже если вы не говорите по-французски, вы заметите, что средняя линия - это мусор. И это не только бесполезная строка, она заменяет реальный контент.
Средство просмотра электронных книг калибра отображает исходный pdf
вместе с мусором, в то время как оно отлично отображается с моим стандартным средством просмотра pdf. Я пытался конвертировать в mobi
, txt
, mkd
, но безрезультатно.
Я попробовал pdftotext
и онлайн-инструмент http://www.zamzar.com/ и получил тот же результат.
Затем я преобразовал pdf
в файлы .pbm
и попытался запустить gocr
и ocrad
. Результаты OCR были довольно интересными, но недостаточно хорошими, чтобы использовать их как есть.
Jérôme _sȧit aimer le rouge. Sa marotte
consistait surTout à l'enlever. Dégrafer la
dentelle était un geste qu_l effectuait avec la
Будете ли вы иметь представление о других инструментах, которые могут помочь в этом процессе, или о возможностях тонкой настройки программ калибровки или распознавания текста?
Примечание: я использую Ubuntu 13.10.