HTTP на самом деле не имеет понятия о каталогах. Косые черты, кроме первых трех (http://example.com/
), не имеют какого-либо особого значения, кроме ..
в относительных URL. Поэтому, если сервер не следует определенному формату, нет способа «загрузить все файлы в указанном каталоге».
Если вы хотите загрузить весь сайт, лучше всего рекурсивно просматривать все ссылки на главной странице. Керл не может этого сделать, но wget может. Это будет работать, если веб-сайт не слишком динамичен (в частности, wget не будет видеть ссылки, созданные с помощью кода Javascript). Начните с wget -r http://example.com/
и просмотрите разделы «Параметры рекурсивного извлечения» и «Параметры рекурсивного принятия / отклонения» в руководстве по wget, чтобы найти более подходящие параметры (глубина рекурсии, списки исключений и т.д.).
Если веб-сайт пытается заблокировать автоматические загрузки, вам может потребоваться изменить строку пользовательского агента (-U Mozilla
) и игнорировать robots.txt
(создайте пустой файл example.com/robots.txt
и используйте параметр -nc
чтобы wget не пытается загрузить его с сервера).