1

Это как HTTrack может загружать только те сайты, которые имеют индексную страницу? И на индексной странице должны быть все ссылки на все остальные страницы сайта, верно? Или, по крайней мере, все страницы на сайте должны быть как-то связаны ссылками, верно? Итак, если есть хотя бы одна страница, на которой нет ни одной ссылки, и на которую не ссылаются никакие другие страницы, то этот тип страниц не будет загружен HTTrack, верно?

Я пытаюсь загрузить веб-сайт на бесплатном хосте (на самом деле это не веб-сайт, а скорее коллекция изображений и некоторые HTML-документы, которые не обязательно связаны друг с другом). Этот веб-сайт будет закрыт через две недели, поэтому мне нужно поторопиться, чтобы загрузить все мои фотографии с этого сайта. Поэтому я попытался HTTrack, пытаясь загрузить весь сайт, но в процессе я получил сообщение, в котором говорилось следующее:

WinHTTrack Сайт Копир

    • ЗЕРКАЛО ОШИБКА! * * HTTrack обнаружил, что текущее зеркало пусто. Если это было обновление, предыдущее зеркало было восстановлено. Причина: не удалось найти первую страницу (страницы) или возникла проблема с подключением. => Убедитесь, что веб-сайт все еще существует, и / или проверьте настройки прокси! <=

Я использую Windows XP.

1 ответ1

2

Вы правы, что такие инструменты будут работать только на основе ссылок между страницами. Если на странице нет других страниц, указывающих на нее, она "невидима" для HTTrack (и других инструментов "паук"). Если вы знаете URL-адреса этих "несвязанных" страниц, вы добавляете их вручную.

Однако, если на веб-сервере включена функция "Просмотр каталога", указав URL-адрес, содержащий каталог и не содержащий имени страницы, будет отображен список всех файлов в каталоге. Но это редко активируется по соображениям безопасности. В большинстве случаев, если имя страницы не указано, веб-сервер будет обслуживать страницу по умолчанию (index.html, index.php, default.html, ...) вместо содержимого каталога.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .