1

Оглядывался в течение часа, но я никуда не доберусь быстро.

Я хочу захватить одну веб-страницу в неделю, на которой есть цены. Сайт представляет собой аукционный сайт по животноводству.

Суть в том, что имя целевой страницы меняется неделя на неделю, поэтому мне нужно иметь возможность указать местоположение ССЫЛКИ на главной странице, чтобы получить нужную мне страницу.

Я мог бы написать что-нибудь за день или два, чтобы проверить это, но ДОЛЖНА быть программа, которая уже делает это. Я не против написания кода, но я не люблю заново изобретать колесо.

Я только что получил HTTrack по другим причинам, и если он это сделает, просто скажите, и я пойду разбираюсь. (Буквально только что он вел его 30 минут назад, так что пока не рассматривал его, за исключением того, чтобы захватить веб-сайт для клиента. )

Посмотрел на Selenium очень быстро, но это кажется излишним для того, что я хочу?

Немного больше информации: это ссылка в том же месте на главной странице.
Я хотел бы сохранить его с датой, предварительно прикрепленной к локальному имени файла. Я бы предпочел сделать все это на Windows, потому что это то, что я знаю лучше всего. ДОЛЖЕН быть запущен через планировщик в Win 7!

В конце концов, я хотел бы почистить страницу, чтобы собрать цены и поместить их в Excel, так что если бы кто-нибудь использовал для этого инструмент, это было бы еще лучше. (Я все еще хочу сохранить страницу с ценами локально, в качестве резервной копии любого скриншота экрана, который я мог бы сделать. )

2 ответа2

1

Вы можете скачать страницу с чем-то вроде wget. Просто поместите команду в командный файл и запланируйте запуск командного файла раз в неделю.

Однако, поскольку вы в конечном итоге захотите проанализировать файл, я просто посмотрю на open в ruby и напишу скрипт для сохранения страницы, которую вы позже развернете для выполнения анализа.

0

Поскольку одним из ваших требований является выполнение задачи в Windows, а ваша ссылка легко определяется и доступна с домашней страницы, я бы порекомендовал использовать скрипт AutoIT для выполнения этой функции. Я бы особенно следовал примерам, перечисленным для пользовательских функций IE, в которых имеется полезная библиотека вспомогательных функций, позволяющая сократить нагрузку на программирование для простых задач.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .