У меня около 350 файлов XML, распределенных по каталогу /abc
. Я хотел бы найти все случаи, когда значение атрибута alt в точности равно « бла-бла »:
<image alt="blah blah" src="../webcontent/filename.png">
<caption>
Figure 1.1: Typical Components of Blah Blah
</caption>
</image>
и замените значение атрибута alt
содержимым, заключенным в caption
(удаляя символы новой строки)
<image alt="Figure 1.1: Typical Components of Blah Blah" src="../webcontent/filename.png">
<caption>
Figure 1.1: Typical Components of Blah Blah
</caption>
</image>
Я открыт для запуска сценария в Ubuntu или Windows или использования любого инструмента для редактирования текста.
Не безопасно предполагать, что переводы строки и отступы совпадают. Кроме того, не все изображения имеют подписи. Все XML-документы в пути правильно сформированы.
Есть ли простой способ сценария этой замены на месте? Я был бы открыт для чего-то, что работает для одного файла; Я могу расширить его, чтобы запустить рекурсивно.