Есть ли способ получить исходный код каждой веб-страницы на веб-сайте и сохранить их в одном текстовом файле? С соответствующими символами CRFL, как если бы страницы были получены по отдельности в Internet Explorer? Я пробовал Wget, но не могу найти правильную комбинацию опций.
-2
1 ответ
0
Если веб-сервер был настроен правильно, нет, это невозможно. Это связано с тем, что если вы сможете загрузить исходный код веб-сайтов, вы сможете получить ценные данные, такие как данные аутентификации базы данных веб-сайта.
Однако вы можете загрузить отображаемый HTML -код веб-страницы, как он отображается в вашем интернет-браузере, с помощью wget
:
wget -E -H -k -K -p URLHERE
Однако некоторые веб-серверы могут рассматривать wget
как робота (программу, которая очищает и сохраняет данные с веб-страниц), в этом случае вы можете использовать ключи -e robots=off
в вашей команде wget
.