Я пытаюсь собрать данные с сайта для исследования.
URL-адреса хорошо организованы в формате example.com/x, где x - это возрастающий номер, а все страницы структурированы одинаково. Мне просто нужно взять определенные заголовки и несколько номеров, которые всегда находятся в тех же местах. Затем мне нужно будет получить эти данные в структурированной форме для анализа в Excel.
Я использовал wget прежде, чтобы загрузить страницы, но я не могу понять, как получить определенные строки текста.
В Excel есть функция для сбора данных из Интернета (Данные-> Из Интернета), но из того, что я вижу, она позволяет загружать только таблицы. К сожалению, мне нужны данные не в таблицах.