Когда я экспортирую файл из Word или TextEdit, я получаю очень раздутый HTML, полный сумасшедших тегов style
в каждом абзаце, поэтому я даже не могу почистить его вручную.
Единственная информация, которую я хочу сохранить:
теги
<h1>, <h2>, <h3>, <p>
.Выравнивание (по центру, слева, справа)
ссылки, внешние и внутренние (для оглавления)
теги
<img>