1

Я знаю, что подобные вопросы задавались ранее, но прежде чем пометить его как дубликат, позвольте мне объяснить.

Я только что купил .pdf электронную книгу онлайн и хотел бы, чтобы она была .epub . Я обычно использую calibre (v1.0.0) для такого рода задач с большим успехом. На этот раз, кажется, что большие пропорции линий перепутались во время преобразования.

Jérôme disait aimer le rouge. Sa marotte
FRQVLVWDLW VXUWRXW ¡ O#HQOHYHU 'ªJUDIHU OD
dentelle était un geste qu'il effectuait avec la

Даже если вы не говорите по-французски, вы заметите, что средняя линия - это мусор. И это не только бесполезная строка, она заменяет реальный контент.

Средство просмотра электронных книг калибра отображает исходный pdf вместе с мусором, в то время как оно отлично отображается с моим стандартным средством просмотра pdf. Я пытался конвертировать в mobi , txt , mkd , но безрезультатно.

Я попробовал pdftotext и онлайн-инструмент http://www.zamzar.com/ и получил тот же результат.

Затем я преобразовал pdf в файлы .pbm и попытался запустить gocr и ocrad . Результаты OCR были довольно интересными, но недостаточно хорошими, чтобы использовать их как есть.

Jérôme _sȧit aimer le rouge. Sa marotte
consistait surTout à l'enlever. Dégrafer la
dentelle était un geste qu_l effectuait avec la

Будете ли вы иметь представление о других инструментах, которые могут помочь в этом процессе, или о возможностях тонкой настройки программ калибровки или распознавания текста?

Примечание: я использую Ubuntu 13.10.

0