1

У меня есть файл журнала с ошибками от миграции, которую я делаю из почтовых систем. Мне нужно взять журналы ошибок миграции пользователей и сделать их читаемыми для конечного пользователя. Файл журнала может содержать сотни ошибок. Каждая ошибка в формате XML. Вокруг тегов обычно много постороннего текста, но важные вещи находятся между тегами темы и даты. Каков наилучший способ проанализировать этот файл и поместить вывод в другой файл?

тема сообщения 11 марта 2010 .... больше тегов

3 ответа3

1

Я не знаю, как вы относитесь к Java, но если вы заинтересованы, вы можете проверить эти учебники.

Урок 1 Урок 2

Если нет, то хорошими ключевыми словами для Google являются Sax-анализ и DOM-анализ. Вы можете прочитать о них в Википедии, если вы хотите глубокие различия между ними. Для устранения 100 ошибок, я думаю, различия между ними будут минимальными.

0

Многие языки имеют встроенные xml-парсеры. В зависимости от вашего языка вы можете посмотреть, что он может предложить.

0

Ответ: XSLT

Вы можете написать XSLT или иметь написанный для вас, который может преобразовать любой исходный XML-файл или текст в целом в другой текстовый вывод. Обычно XSLT используется для преобразования XML в другой формат XML или в HTML/XHTML, но также может использоваться для генерации CSV или других типов вывода простого текста. Теперь учтите, что XSLT - не самая интуитивно понятная грамматика XML для изучения, и она достаточно многословна, однако она очень мощная и не должна занимать более 15 строк или около того, чтобы создать что-то, что будет делать то, что вы описали, и извлечь две части данных. и поместите в простой текстовый файл.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .