Я хочу загрузить HTML-файлы (пример: http://www.brpreiss.com/books/opus6/) и присоединить их к одному HTML-формату или другому формату, который я могу использовать для чтения электронных книг. Сайты с бесплатными книгами не имеют стандартной подкачки страниц, они не являются блогами или форумами, поэтому не знаете, как выполнить автоматический обход и объединение.
5 ответов
То, как я делал это, было Caliber.
Это стало слишком большой болью, поэтому я создал Chrome Extension, чтобы упростить его.
Это называется EpubPress (http://epub.press).
Это позволяет создавать электронные книги из вкладок Chrome.
Надеюсь, это поможет!
Pandoc может взять ссылку на страницу (или HTML-файл) и преобразовать ее в pdf/epub ...
Я не уверен, что это будет ползти. Если этого не произойдет, вы можете сначала сканировать страницы с помощью wget или чего-то еще (или просто собирать ссылки) и передавать их pandoc.
Вы можете использовать https://getpocket.com и карманный рецепт калибра, доступный через меню "Получить новости".
HTTrack является хорошим вариантом - он будет создавать электронную книгу с веб-сайта: ее можно скачать здесь: https://www.httrack.com/ HTTrack "позволяет загружать сайт World Wide Web из Интернета на локальный сайт. каталог, рекурсивное построение всех каталогов, получение HTML, изображений и других файлов с сервера на ваш компьютер. HTTrack организует относительную структуру ссылок исходного сайта. "
Затем вы можете конвертировать HTML в EPUB, AZW3 или PDF с помощью Caliber или любого другого программного обеспечения для конвертации HTML в epub.
Второй вариант конвертации непосредственно в EPUB - это EpubPress: он имеет расширения, позволяющие использовать Firefox (только v44.0+) или Chrome.
Чтобы использовать это программное обеспечение, вам нужно открыть окно браузера. Каждая вкладка - это, по сути, «глава» в вашей электронной книге. Расположите вкладки в нужном порядке появления, затем активируйте epubpress - он загрузит и расположит вкладки в порядке их появления в формате .epub. Надеюсь это поможет!
* Тем не менее, обратите внимание, что EpubPress загружает отдельные веб-страницы, а не «веб-сайт», как делает HTTrack. Чтобы загрузить веб-сайт с EpubPress, вы должны открыть каждую ссылку на веб-сайте в виде отдельной вкладки, а затем использовать Epubpress для сбора этих ссылок в формате .epub.