Я хочу получить отдельные изображения с сайта. На сайте есть фотографии. Нажатие на фотографии приводит к другой странице. Я хочу получить фотографии из тега img src в html. У меня уже есть код Unix для извлечения строк img src, которые я хочу.
Пример: img src = "http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"
Когда я использую wget для загрузки этого URL, я получаю нулевой файл.
Когда я вручную ввожу этот URL в свой браузер, изображение загружается в середине экрана. Когда я нажимаю на свойства, это файл JPEG. Когда я смотрю на источник HTML для страницы, он дает следующее:
<html><head> … </head><body><img class="decoded" src="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1" alt="http://website.com/photo.php?user_id=231&photo_id=23&thumbnail=1&SID=kdede19f8z1t38be1"></img></body></html>
Единственное, что я могу понять, это то, что это связано с тегом:
<img class="decoded"
Есть идеи?