Попытка найти способ сделать этот процесс на ежедневной или даже почасовой основе:

  1. Зайдите в Amazon и найдите "товар"
  2. Найдите конкретный продукт в результатах поиска (он всегда будет иметь одинаковое название)
  3. Захватить ссылку на конкретный товар (он периодически меняется)
  4. Сохраните эту ссылку где-нибудь и обновите целевую страницу с ссылками на нее (может быть HTML, страница Google, что угодно)

Есть идеи, с чего начать?

1 ответ1

0

Я бы предложил заглянуть в библиотеку под названием Selenium. Он также существует как расширение для Firefox, но я бы также установил lib, чтобы поиграть с кодом, который генерирует расширение. Лично я использовал Python.

Расширение действует как рекордер для всех действий, которые вы выполняете в вашем веб-браузере. Как только вы закончите запись, он попытается сгенерировать код на выбранном вами языке. По моему опыту, вам придется немного подправить этот код, чтобы заставить его работать правильно, но все будет в порядке.

Используя Selenium, вы можете написать скрипт, который:

  1. Открывает браузер на amazon.com
  2. Окно поиска кликов
  3. Ищет название предмета
  4. Переходит на страницу товара
  5. Захватывает URL страницы элемента
  6. Экспортирует URL в .txt или что-то еще, что вы хотите с ним сделать

Как только вы получите работающий код, вы можете настроить задачу в crontab в Linux или Windows Scheduler в Windows, чтобы выполнять ваш скрипт так часто, как вам нравится.

Вот страница документации для Selenium для получения дополнительной информации http://www.seleniumhq.org/docs/

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .