-1

Я прочитал обсуждение в Как загрузить сайт с архива Wayback Machine? и следовал инструкциям на https://github.com/hartator/wayback-machine-downloader, чтобы установить wayback_machine_downloader, и использовал его для успешной загрузки сайта с сайта archive.org.

Есть ли способ просмотреть эти страницы, чтобы при щелчке по ссылке вы получали соответствующую автономную страницу, а не пытались открыть живую страницу в Интернете?

1 ответ1

0

Если программа, которую вы использовали, не перезаписывала URL-адреса для вас автоматически, возможно, у вас есть два основных варианта ...

Первый вариант - создать персональный сервер, который отражает загруженный вами контент. Вы должны настроить веб-сервер, такой как Apache или Nginx (или другой вариант), на своем локальном ПК, а затем создать хотя бы один соответствующий виртуальный хост для устаревших доменов. Этот хост (или хосты) будет содержать файлы, которые вы скачали. Вам потребуется некоторая форма разрешения DNS для сопоставления старого домена с вашим локальным веб-сервером, но это, вероятно, может быть сделано с вашим файлом hosts или даже с полной настройкой локального DNS с помощью BIND или подобного программного обеспечения.

Если приведенное выше решение нежелательно, вам, скорее всего, придется самостоятельно переписать URL-адреса. Конечно, вы можете сделать это вручную, но (в зависимости от размера проекта) вы можете захотеть взглянуть на язык сценариев Python и модуль под названием Beautiful Soup. Красивый суп создан для разбора веб-страниц и потенциально может переписать ссылки (при условии, что вы пишете скрипт для этого).

В качестве небольшого предостережения, какой бы метод вы ни выбрали, вам, вероятно, все равно придется взглянуть на исходный код HTML, чтобы определить, какие ссылки требуют внимания, а какие - нет. Также полезно помнить, что внешние ссылки могут не работать независимо от того, что archive.org также не сделал копию этого контента.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .