Я хотел бы написать сценарий, который записывает размер очереди просмотра закрытых голосов на SO (в настоящее время ~ 95,5 тыс.), Опрашивая всего несколько раз в час, чтобы я мог построить общую тенденцию. Я знаю, что я собираюсь сделать в отношении синтаксического анализа, т.е. учитывая следующую часть ответа HTTP,
<div class="dashboard-num" title="95,508">95.5k</div>
Я бы применил регулярное выражение
<div\s+class="dashboard-num"\s+title="([^"]+)
и разделить на \D
и взорвать массив, чтобы оставить только цифры, или что-то подобное. (Да, «Пони, он приходит», но это простая и грязная работа, во время которой я не ожидаю, что HTML-код переполнения стека изменится.)
В настоящее время у меня нет установки UNIX / Linux, иначе я бы собрал что-то вместе, используя cron, cURL и Perl (или sed или awk, если я чувствую себя достаточно смелым). Какой самый простой способ сделать это в Windows? Есть ли какая-нибудь утилита, которая создана для этого? Я готов установить Cygwin и такое программное обеспечение, если это действительно самый простой способ (скажем, по сравнению с написанием пакетных сценариев), но я надеюсь на некоторую программу, в которую я смогу ввести URL и регулярное выражение и быть в пути.