Я видел, что есть много электронных книг, доступных в Интернете. Как они созданы из книги или вы пишете ее вручную? Если они захватывают изображение из книги, как сделать шрифты копируемыми?
2 ответа
В прошлом электронные книги были в основном в формате PDF, но книги, которые читаются на Kindle, имеют формат .mobi, а книги, которые читаются на любом другом устройстве чтения, - в формате ePub. Оба формата основаны на HTML, типе разметки, который используется для веб-страниц. PDF-файлы представлены в двух формах - если вы сканируете что-либо, сканы можно превратить в PDF, но это всего лишь изображение документа. Важным является процесс распознавания текста, который превращает текст в документе в машиночитаемый текст - тип текста, который мы с вами используем здесь. OCR не идеален, но есть некоторые методы, которые лучше, чем другие. Когда текст находится в машиночитаемом виде, его можно разметить в HTML и поместить в формат .mobi или ePub.
по большей части мастера являются цифровыми, и его просто сохранить в формате PDF (на самом деле некоторые издатели даже выпускают книги в виде электронных книг до выпуска физической копии)
В противном случае это вопрос сканирования книг, использования OCR для преобразования большей части текста в текст, повторного считывания и добавления любых изображений обратно. Шрифты довольно стандартные, или используется достаточно близкий шрифт.