Я хочу получить отдельные изображения с сайта. На сайте есть фотографии. Нажатие на фотографии приводит к другой странице. Я хочу получить фотографии из тега img src в html. У меня уже есть код Unix для извлечения строк img src, которые я хочу.

Пример: img src = "http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"

Когда я использую wget для загрузки этого URL, я получаю нулевой файл.

Когда я вручную ввожу этот URL в свой браузер, изображение загружается в середине экрана. Когда я нажимаю на свойства, это файл JPEG. Когда я смотрю на источник HTML для страницы, он дает следующее:

<html><head> … </head><body><img class="decoded" src="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1" alt="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"></img></body></html>

Единственное, что я могу понять, это то, что это связано с тегом:

<img class="decoded"

Есть идеи?

1 ответ1

0

Я понял. Поскольку сайт php, мне нужно было добавить --trust-server-names в качестве аргумента в wget. Как только я это сделал, я мог загрузить изображение без проблем.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .