Я пытаюсь использовать wget для загрузки последних 100 историй игр для кено с сайта лотереи МО.

Диапазон образцов -> 1420698-1420797

Веб-страница требует ввода диапазона и затем нажатия кнопки. Я пытаюсь автоматизировать процесс, но без особого успеха. Ниже приведен список значений, которые я выкопал на странице, указанной выше.

<form name="winnersForm">
  <input type="text" name="drawnumber" size="8" value=""/>
  <input type="submit" value="Display Winning Number" onClick="window.open('../club_keno/club_keno_drawings.html')/>

Я не уверен, что wget может делать подобные вещи, так как для этого может потребоваться некоторый код Java, такой как идентификационный номер сеанса. Я попытался разобрать все в одну строку, а затем использовать команду оболочки, чтобы запустить его, но не получил ничего, кроме главной страницы в моей загрузке, без номеров. Я прочитал руководство и искал примеры, но не могу найти ничего для того, что я пытаюсь сделать. Я написал программу, которая удалит все теги и отформатирует данные в текстовый файл, который я использую для других игр.

Любая помощь будет принята с благодарностью.

1 ответ1

0

Похоже, что сервер не выполняет никакой проверки или проверки сеанса, и я могу получить все числа.

Из вашего браузера copy as cURL (см. Здесь). Удалите посторонние заголовки и добавьте фильтрацию.

Я закончил с:

curl 'http://www.molottery.com/gameHistory.do?method=ckDisplay&cmt=true' -H 'Accept-Encoding: gzip, deflate' -H 'Accept-Language: en-US,en;q=0.8' -H 'Content-Type: application/x-www-form-urlencoded' -H 'Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8' --data 'drawnumber=1420698-1420797' --compressed | grep td

что приводит к:

                    --------
                    -----------
                 <td align="center">52</td><td align="center">44</td><td align="center">10 - 14 - 20 - 21 - 24 - 27 - 28 - 32 - 33 - 39 -
                            41 - 42 - 44 - 45 - 46 - 48 - 52 - 57 - 58 - 72</td>
                            <td align="center">1</td>
                            <td align="center"> $1,077</td><td align="center"> $5,966</td><td align="center"> $15,210</td></tr>
                    <td>1420789</td>
                    <td>07-06-16</td>
                    --------
                    -----

Теперь все, что нужно вашему сценарию - это обновить drawnumber запроса в запросе.

Я не пробовал с wget, но процесс должен работать нормально.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .