Кто-нибудь знает какое-либо программное обеспечение или скрипт для загрузки изображений из последовательности галерей? Где галереи находятся на страницах, таких как www.example.com/1 ... www.example.com/9999 и на каждой странице есть набор миниатюр, напрямую связанных с полноразмерным изображением?

Я пытался wget с чем-то вроде wget -A.JPG -r -l1 -np www.example.com/1 но он также получает эскизы, которые я не хочу, и я не знаю, как сделать это скачать последовательность страниц.

2 ответа2

1

Не уверен, что это именно тот эффект, который вам нужен, но попробуйте --no-parent в подходе wget. Он не будет загружать файлы из родительских каталогов. Это не очень поможет в случае глубокого дерева, но похоже, что у вас есть только 1 уровень, чтобы иметь дело с.

Более сложный, и я бы обернул wget в скрипт.

1

Я бы порекомендовал использовать скрипт. Просмотрите справочную страницу wget, в частности, --follow-tags и --ignore-tags , которые могут помочь вам следить за некоторыми тегами html и игнорировать их (тогда вы можете избежать загрузки миниатюр и следования тегам <a> в полноразмерные изображения). Чтобы зациклить сценарий, вам нужно что-то вроде этого:

for ($i = 1;$i -le 9999;$i++)
{
     iex "C:\path\to\wget.exe -A.JPG -r -l1 -np www.example.com/$i"
}

так как вы не предоставили сайт, мы можем предположить, что это макет только по вашему описанию. Удачи!

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .