Я пытаюсь использовать wget для получения веб-страницы, которая отображает результаты для искомой строки. Однако на найденной странице отображаются только результаты пустой строки. Судя по всему, поисковые термины помещаются в какой-то массив. Как использовать wget для получения всего URL?

name@ubuntu:~$ wget -U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' http://www.somesite.com/search?tm_link=tm_header_search&user_input=search+of+terms&q=search+of+terms [1] 2938 [2] 2939 name@ubuntu:~$ --2013-11-07 21:22:03-- http://www.somesite.com/search?tm_link=tm_header_search Resolving www.somesite.com (www.somesite.com)... 23.42.84.199 Connecting to www.somesite.com (www.somesite.com)|23.42.84.199|:80... connected. HTTP request sent, awaiting response... 200 OK Syntax error in Set-Cookie: GEORAN=1; path=/; domain=.somesite.com; expires= at position 52. Length: unspecified [text/html] Saving to: `search?tm_link=tm_header_search'

[ <=>                                   ] 146,249     --.-K/s   in 0.1s    

2013-11-07 21:22:04 (1,14 МБ / с) - поиск?tm_link = tm_header_search 'сохранено [146249]

1 ответ1

2

Ваш синтаксис вызова оболочки неверен. То, что вы делаете, вызывает wget -U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' http://www.somesite.com/search?tm_link=tm_header_search (обратите внимание на ' после агента пользователя), и & является команда оболочки , чтобы установить wget в фоновый режим. Все, что касается этого пункта, является отдельной командой.

Вам нужно исправить свою команду на что-то вроде wget -U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' 'http://www.somesite.com/search?tm_link=tm_header_search&user_input=search+of+terms&q=search+of+terms'

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .