У меня есть HTML-документ, заполненный терминами, которые мне нужно поместить в электронную таблицу.
Они следуют этой основной схеме:
<ul>
<li class="name"><a href="spot.html">Spot</a></li>
<li class="type">Dog</li>
<li class="color">Red</li>
</ul>
<ul>
<li class="name"><a href="mittens.html">Mittens</a></li>
<li class="type">Cat</li>
<li class="color">Brown</li>
</ul>
<ul>
<li class="name"><a href="squakers.html">Squakers</a></li>
<li class="type">Little Parrot</li>
<li class="color">Rainbow</li>
</ul>
Это очень последовательно.
Мне нужно извлечь строку из li.name a
(так, "Spot"), но только если type
"Dog" или "Parrot", и поместить их в электронную таблицу.
Я пытался использовать способность Sublime Text находить с помощью регулярных выражений, но я действительно изо всех сил, и так как регулярные выражения и HTML обычно не играют хорошо, мне было интересно, есть ли лучший и более простой способ сделать это. Благодарю.