Я хочу написать код для выдачи имен героев сериалов или фильмов с использованием сценария оболочки ... Я планирую сделать это, извлекая источник страницы из результатов поиска Google, для которого мне потребуется источник ссылки на страницы ... например, по этой ссылке я пытался напрямую использовать wget, но он выдает код ошибки 8, а также curl -L передает "неправильный" источник страницы

1 ответ1

0

Если вы посмотрите на сообщения журнала wget, то увидите, что наконец-то получили "403 Forbidden" от Google.

Так что приглашайте взглянуть на этот ответ Stackoverflow. Google не хочет, чтобы эта страница результатов поиска использовалась автоматически, и я полагаю, у них есть довольно веские причины.

Если вы все равно хотите это сделать, вы можете установить другую строку User Agent с помощью wget --user-agent=Chrome -O results.html 'https://www.google.com/search?hl=en&q=iron%20man%20character%20names'

Тем не менее, ответ, который вы получаете от Google, не так просто разобрать - может быть, вы можете использовать базу данных фильмов для этой задачи?

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .