Я хотел бы отфильтровать html-ответ, поступающий с выхода cURL. Какой фильтр я должен применить? Просмотр html-контента с Midnight Commander не проблема, он показывает их в виде довольно отформатированного простого текста, так что я думаю, что такой фильтр есть.
4 ответа
Мы называем эти фильтры «веб-браузерами» - программой, которая анализирует HTML-код и выводит симпатичный документ.
Links - это один из консольных веб-браузеров, который работает в Linux.
Elinks это еще один.
Также есть W3M.
Вы всегда можете скопировать свой HTML-код в текстовый файл и открыть его в браузере с графическим интерфейсом, например Firefox, Chrome, Opera и т.д.
Пожалуйста, не используйте регулярные выражения для разбора HTML.
РЕДАКТИРОВАТЬ. Я только что понял, что вы можете захотеть улучшить ваш HTML и увидеть его с помощью тегов. В этом случае вы можете использовать HTML Tidy Library Project или
скопируйте ваш HTML в текстовый файл и окружите его тегами <pre>
</pre>
. Затем откройте его с помощью браузера.
Полуночный командир использует "ссылки" или "рысь". Я подозреваю, что у вас установлен один из них, если вы видите проанализированный HTML в mcview.
Если вы просто хотите посмотреть привлекательный html-вывод curl, тогда достаточно w3m, links или lynx, как предложено выше.
Если вы хотите проанализировать или сделать что-нибудь с выходными данными, то я рекомендую либо пакет html-xml-utils linux, либо Beautiful Soup, который является очень удобным пакетом Python для любого проекта, который включает в себя очистку веб-страниц.