Я новичок в веб-соскоб. Я пытаюсь собрать связанную информацию в https://www.harris.com/careers/jobs для каждой вакансии. Информация содержится в следующем XPath: //* [@ id = "frmJobs"]. Я использую плагин Chrome "Scraper". Плагин не может выбрать кадр, используя все доступные селекторы. Мне интересно, есть ли простой способ создать карту сайта, которая попадет внутрь фрейма и извлечет всю связанную информацию. Пожалуйста, дайте мне знать, если это вообще возможно.
1 ответ
-1
Ну, я попробовал Octoparse, инструмент для поиска в сети, чтобы извлечь данные фрейма, и я получил всю необходимую информацию. Я ввожу "общественное здравоохранение", например, в текстовое поле для поиска работы и извлечения этих результатов. Я загружаю файл .otd, который является правилом конфигурации, используя Octoparse для извлечения заданий общественного здравоохранения. Результаты извлечения рабочих мест общественного здравоохранения приведены ниже.