Вопросы с меткой [webarchive]

Руководство по использованию метки webarchive отсутствует.

12
голосов
5ответов
8k показов

Проблемы с использованием wget или httrack для зеркалирования архивированного сайта

Я пытаюсь использовать wget для создания локального зеркала сайта. Но я обнаружил, что я не получаю все страницы ссылок. Вот сайт ...
3
голоса
3ответа
11k показов

Извлечение файлов из веб-архива (.warc)

У меня есть несколько веб-сайтов, которые я архивирую, чтобы сохранить там много связанных файлов, в частности, несколько PDF-файлов. У меня не было проблем с использованием сканера Heritrix для ...
2
голоса
2ответа
393 показов

Как мне архивировать веб-страницы, на которые есть ссылки в моих закладках Delicious?

Я ищу способы быстрого резервного копирования веб-страниц, которые я собрал в своих закладках Delicious, для защиты от linkrot и т.д. Самый эффективный метод, который я нашел до сих пор, - это ...
2
голоса
1ответ
41 показов

поиск инструмента создает компактные веб-архивы

Я ищу инструмент для эффективного архивирования блога, который меняется каждый день или даже два или три раза в день. Я не имею в виду, что отдельные сообщения в блоге меняются - не всегда, во всяком ...
2
голоса
1ответ
2k показов

Скачать сайт с WayBack Machine

Я нашел отличный сайт на компьютере WayBack, который в настоящее время не работает, и домен продается. Я хотел использовать его в автономном режиме. Я попытался использовать WinHTTrack, но он только ...
1
голос
1ответ
99 показов

На Mac веб-страница может быть напечатана в виде файла PDF, но изображения разделены на страницы ... какое-нибудь решение?

Например, страница для руководства по Rails 3.0: http://railstutorial.org/chapters/beginning при печати в формате PDF с использованием Firefox, Chrome или Safari на Mac все изображения обрезаются ...
1
голос
0ответов
206 показов

Есть httrack для резервного копирования сайта?

Я пытаюсь сделать резервную копию сайта с помощью httrack, но он не делает то, что я хочу. Это продолжается уже 20 минут и загружает то, что выглядит как бессмысленные изображения и js-файлы с других ...
1
голос
0ответов
49 показов

Как загрузить сайт из веб-архива

https://gist.github.com/mildred/7a33bb9c263f025b59e6 Я пробовал это на Mac, но он возвращает эту ошибку. line 18: listing.txt: Permission denied
1
голос
1ответ
427 показов

Как открыть (возможно) поврежденный веб-архив в Windows

Прежде всего, я впервые обрабатываю файл WARC ... У меня есть файл веб-архива, который кажется поврежденным (каким-то образом), я установил Safari в Windows и получаю следующее (то же самое ...
0
голосов
1ответ
70 показов

Лучший подход к архивированию сайта периодически

Я работаю над подходом к периодическому (динамически генерируемому) архивированию нашего веб-сайта (скажем, каждый месяц) и сохранению его версии, чтобы я мог вернуться и перетащить страницу через ...
0
голосов
1ответ
44 показов

Просмотреть архивированный сайт

У меня есть файлы HTML / веб-страницы, хранящиеся в папке локально на моем компьютере. Я могу просматривать этот контент просто отлично, используя любой браузер. Однако, в долгосрочной перспективе, я ...
0
голосов
0ответов
22 показов

Использовать старые плагины браузера Java?

Как использовать старые версии плагина Java SE в Firefox? У меня есть внутренняя веб-страница, которая пытается обнаружить наличие Java Web Start, но это сломалось, когда мы обновили все машины до ...
0
голосов
1ответ
628 показов

В MS Word открытие TXT-файла приводит к ошибке «Не является допустимой веб-страницей с одним файлом»

У меня есть заголовок электронной почты, хранящийся в файле .txt. Автоматизированный процесс открывает файл в Ms Word 2016. Word выдает ошибку «Не является допустимой веб-страницей с одним файлом». ...
-1
голос
1ответ
23 показов

Команда для просмотра онлайн-архивов на CLI

Есть ли команда оболочки, которая позволяет нам проходить через архив, например, http://archive.apache.org/dist/hadoop/hive/ через CLI? Некоторая команда, которая позволяет нам выполнять функции как ...