28

Я получил Kindle на Рождество, и я хотел бы прочитать некоторые научные статьи на нем. Почти все эти документы представлены в формате PostScript или PDF и предназначены для бумаги формата A4. Смотрите пример здесь.

Отправка PDF-файлов на мой адрес @ kindle.com (с "convert" в качестве темы) не работает, потому что конвертер не может распознать макет с двумя столбцами, который так распространен для документов такого типа, и рассматривает его как один столбец, смешивание абзацев из обеих колонок. То же самое касается Калибра, если я не делаю это неправильно.

Я, конечно, могу читать PDF-файлы на моем Kindle в альбомном режиме, но мелкий шрифт трудно читать, и для его увеличения требуется панорамирование во всех направлениях из-за вида столбцов.

Поэтому мой вопрос: если не считать преобразования файлов вручную, есть ли какие-нибудь решения, о которых вы можете подумать?


Редактировать:

Руководство Calibre содержит подробное объяснение трудностей преобразования PDF-файлов в другие форматы.

Повторное повторение PDF - это действительно очень плохой формат для использования в качестве входных данных. Если вам абсолютно необходимо использовать PDF, будьте готовы к выводу в диапазоне от приличного до непригодного для использования, в зависимости от входного PDF.

Это в значительной степени подводит итог моего опыта. Я имею в виду решение, но оно включает некоторое программирование анализа компоновки OCR / Document, но я надеюсь избежать необходимости углубляться в эту конкретную область. (Я бы лучше потратил время на чтение, поэтому любые предложения приветствуются.)

1 ответ1

24

Мне нравится K2pdfopt для такого рода вещей.

http://willus.com/k2pdfopt/

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .