3

Я хотел бы отфильтровать html-ответ, поступающий с выхода cURL. Какой фильтр я должен применить? Просмотр html-контента с Midnight Commander не проблема, он показывает их в виде довольно отформатированного простого текста, так что я думаю, что такой фильтр есть.

4 ответа4

3

Мы называем эти фильтры «веб-браузерами» - программой, которая анализирует HTML-код и выводит симпатичный документ.

Links - это один из консольных веб-браузеров, который работает в Linux.

Elinks это еще один.

Также есть W3M.

Вы всегда можете скопировать свой HTML-код в текстовый файл и открыть его в браузере с графическим интерфейсом, например Firefox, Chrome, Opera и т.д.

Пожалуйста, не используйте регулярные выражения для разбора HTML.

РЕДАКТИРОВАТЬ. Я только что понял, что вы можете захотеть улучшить ваш HTML и увидеть его с помощью тегов. В этом случае вы можете использовать HTML Tidy Library Project или

скопируйте ваш HTML в текстовый файл и окружите его тегами <pre> </pre> . Затем откройте его с помощью браузера.

0

для рыси синтаксис такой:

curl ... | lynx --stdin

(см. Как передать HTML в Lynx?)

0

Полуночный командир использует "ссылки" или "рысь". Я подозреваю, что у вас установлен один из них, если вы видите проанализированный HTML в mcview.

0

Если вы просто хотите посмотреть привлекательный html-вывод curl, тогда достаточно w3m, links или lynx, как предложено выше.

Если вы хотите проанализировать или сделать что-нибудь с выходными данными, то я рекомендую либо пакет html-xml-utils linux, либо Beautiful Soup, который является очень удобным пакетом Python для любого проекта, который включает в себя очистку веб-страниц.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .