Я сохраняю рукопись, написанную моим отцом. Файлы данных находятся на 5,25 "дискете. Я успешно прочитал файлы с дисков, но никто из нас не знает, в каком формате находится язык разметки. Он использовался издателями книг еще в начале 1990-х годов.
Вот несколько строк из одного из файлов.
\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\
Кто-нибудь может определить язык разметки, используемый здесь?
У меня есть и эти оригинальные файлы, и опубликованная книга. Мне было бы не очень сложно понять, что означают коды. Но если формат может быть идентифицирован, может быть доступен какой-то автоматический переводчик во что-то более новое (RTF, XML и т.д.).
редактировать
Это как загадка, которую нужно разгадать! Вот как начинается стол:
<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>
Я немного погуглил по таким терминам, как begtab
и setbgut
. Последний обнаружил PDF-документ, в котором, похоже, есть "опечатка", но опечатка - это тег setbgut
почти такой же, как тот, что был в моих файлах.
http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (поиск по setbgut
)
Казалось бы, эта исследовательская работа была разработана с использованием того же программного обеспечения. Я перенес его в Acrobat, и в свойствах говорится, что он был сгенерирован Xyvision Parlance Publisher (XPP). Вот лучшее, что я нашел о них до сих пор: http://www.isgmlug.org/n2-1/n2-1-49.htm
Редактировать 2
Хорошо, теперь я вижу. XPP - это язык разметки, похожий на SGML. Фактически, в литературе по продажам XPP рекламируется, как "легко" взять существующий документ SGML и добавить свои собственные теги. К сожалению, XPP был продан General Dynamics несколько лет назад. Автоматически перевести документ, скажем, в HTML, сложно без DTD. Однако, как отмечали другие, большинство тегов легко понять. Некоторые из них, такие как библиографические ссылки и значения после точки с запятой в тегах, таких как <rrh;1>
и <lp;&-1q>
все еще ускользают от меня. Мне придется сравнить файл с физической распечаткой бок о бок, чтобы все это расшифровать.