3

Обычно в содержании книги каждая строка предназначена для главы или раздела и заканчивается номером страницы, например:

1 first chapter 10
1.1 first section 11
1.1.1 first subsection 12
1.2 second section 13
2 second chapter 14 
2.1 first section 16
2.2 second section 13

Формат закладок в файлах djvu для приведенного выше примера:

(bookmarks
 ("1 first chapter" "#10" 
 ("1.1 first section" "#11" 
 ("1.1.1 first subsection" "#12" ))
 ("1.2 second section" "#13" ))
 ("2 second chapter" "#14" 
 ("2.1 first section" "#16" )
 ("2.2 second section" "#13" ))
)

где основными точками являются спаривание левой и правой скобок для древовидной организации разделов и глав, двойные кавычки для каждого элемента закладки и каждого номера страницы, которому предшествует знак # . Разделение между строками и отступами просто для удобства просмотра и редактирования текстового файла закладок вручную и не имеет никакого значения.

Мои вопросы:

  1. Существуют ли какие-либо удобные способы преобразования простого текстового файла оглавления в формат закладок djvu, который может максимально уменьшить ручную обработку? Это может быть достигнуто с помощью приложений для обработки текста, или программирования на некотором языке программирования, или комбинации обоих.

  2. Как предложено в соответствующем ответе Денниса Уильямсона,

    То, что вы делаете, начинает выглядеть немного похожим на XML. Возможно, вам следует использовать реальную вещь и использовать надлежащие инструменты для манипулирования ею.

    быстрый Google обнаруживает djvuxml. С файлами XML легко манипулировать, используя соответствующий модуль Python или Perl или утилиты оболочки, такие как xmlstarlet.

    Интересно, похож ли формат закладок djvu на формат XML (я признаю, что еще не знаком с XML, но желаю изучить его, если он может помочь здесь)? Можно ли использовать инструменты XML для преобразования текстового файла оглавления в формат закладок djvu?

0