Я получил Kindle на Рождество, и я хотел бы прочитать некоторые научные статьи на нем. Почти все эти документы представлены в формате PostScript или PDF и предназначены для бумаги формата A4. Смотрите пример здесь.
Отправка PDF-файлов на мой адрес @ kindle.com (с "convert" в качестве темы) не работает, потому что конвертер не может распознать макет с двумя столбцами, который так распространен для документов такого типа, и рассматривает его как один столбец, смешивание абзацев из обеих колонок. То же самое касается Калибра, если я не делаю это неправильно.
Я, конечно, могу читать PDF-файлы на моем Kindle в альбомном режиме, но мелкий шрифт трудно читать, и для его увеличения требуется панорамирование во всех направлениях из-за вида столбцов.
Поэтому мой вопрос: если не считать преобразования файлов вручную, есть ли какие-нибудь решения, о которых вы можете подумать?
Редактировать:
Руководство Calibre содержит подробное объяснение трудностей преобразования PDF-файлов в другие форматы.
Повторное повторение PDF - это действительно очень плохой формат для использования в качестве входных данных. Если вам абсолютно необходимо использовать PDF, будьте готовы к выводу в диапазоне от приличного до непригодного для использования, в зависимости от входного PDF.
Это в значительной степени подводит итог моего опыта. Я имею в виду решение, но оно включает некоторое программирование анализа компоновки OCR / Document, но я надеюсь избежать необходимости углубляться в эту конкретную область. (Я бы лучше потратил время на чтение, поэтому любые предложения приветствуются.)