Поскольку IMDb планирует удалить все доски объявлений за 2 недели, я бы хотел получить несколько страниц, однако wget
не может это сделать.
Вот что я сделал:
- Вы зарегистрированы как пользователь на странице http://www.imdb.com/boards/.
- Экспортируемые печенье в
cookies.txt
файл с помощью cookies.txt расширения Chrome. Запустите
wget
как показано ниже (как предложено в файлеcookies.txt
):$ wget -x --load-cookies cookies.txt --keep-session-cookies -e robots=off -A Mozilla http://www.imdb.com/boards/ --2017-02-09 15:19:45-- http://www.imdb.com/boards/ Resolving www.imdb.com... 54.239.23.73 Connecting to www.imdb.com|54.239.23.73|:80... connected. HTTP request sent, awaiting response... 503 Service Temporarily Unavailable 2017-02-09 15:19:46 ERROR 503: Service Temporarily Unavailable.
Это должно работать даже без
cookies.txt
, так как страница доступна для общественности.
Чего мне не хватает?