5

Как можно (загрузить и) преобразовать HTML-структуры в EPUB (или любой другой формат, подходящий для ридера Sony PRS-505)?

Мой вопрос не в том, как преобразовать один файл HTML в файл EPUB, поскольку это легко; Я имею в виду, что у меня есть несколько книг, которые я хочу прочитать на моем Sony PRS-505, и эти книги чаще всего онлайн в формате HTML, но со многими взаимосвязанными страницами, и есть одна страница со списком содержимого, как этот пример http://www.edge.org/documents/ThirdCulture/d-Contents.html

... или иногда это немного сложнее, поскольку в оглавлении перечислены только главы, а внутри глав есть ссылки на подглавы, как в этом примере: http: SLASHSLASHwww.hyw.com/Books/WargamesHandbook/Contents.htm (теперь я могу опубликовать только 1 гиперссылку из-за ограничений пользователя, поэтому вместо // используется SLASHSLASH)

Я хочу преобразовать эти примеры и несколько других, с правильными главами, изображениями и некоторым приемлемым форматированием и т.д., Поэтому в основном я хочу сделать правильную книгу из HTML-дерева.

Какой самый простой способ?

1 ответ1

5

Я использую wget для рекурсивной загрузки веб-сайтов (обычно онлайн-руководства по html), а затем, когда все html-файлы находятся в папке, я конвертирую в формат по своему выбору, используя Caliber.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .