Я изучаю литературу, и я хотел бы иметь возможность аннотировать литературные тексты (изначально хранящиеся в HTML или в виде текстовых файлов) построчно или построчно. Я слышал, что базы данных, такие как mySQL или SQLite, были бы хорошими способами сделать это, но я не знаю, с чего начать.

Я чувствую себя комфортно с командной строкой Linux, и в прошлом уже работал с HTML/CSS, поэтому я чувствую себя незапуганным базами данных и прочим ...Я просто не знаю, с чего начать.

2 ответа2

3

В Интернете есть много учебников по MySQL, например, этот.

После изучения основ SQL, если вы хотите создать базу данных для аннотирования строк, вы можете прочитать каждую строку текстового файла отдельно в таблицу с именем LINES_OF_TEXT используя команду LOAD DATA INFILE в MySQL. Затем вы можете иметь другую таблицу с именем ANNOTATIONS которая ссылается на записи в таблице LINES_OF_TEXT ; таким образом, вы можете иметь несколько аннотаций для каждой строки текста. Например:

LINES_OF_TEXT_TABLE
ID    | line
---------------------------------    
1     | This is a line, 
2     | and another one follows.


ANNOTATIONS_TABLE
lines_of_text_ID | annotation
-----------------------------------------------
1                | has a comma
1                | starts with a capital letter
2                | ends with a period
2                | dependent clause
1                | passive voice

Вы можете связать таблицы друг с другом, используя запросы JOIN .

1

Я не уверен, что база данных SQL - ваше лучшее решение здесь. Они на самом деле не предназначены для конечных пользователей, а скорее как хранилище для приложений.

Вы могли бы быть лучше только с помощью электронной таблицы ... ИЛИ ... почему бы не придумать свою собственную схему аннотаций, например <!-- MYNOTE: This is a note !--> , и добавить ее непосредственно в файл. Затем, используя программу поиска по индексу (например, lucene), вы сможете быстро найти свои аннотации.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .