4

Я хотел бы сделать резервную копию содержимого моего блога, который работает на posterous.com. Я хотел бы сохранить все тексты и изображения на локальный диск. Возможность просматривать его в автономном режиме является плюсом.

Что я уже пробовал:

Wget

wget -mk http://myblogurl

Он загружает первую страницу со списком сообщений, затем останавливается с сообщением « 20 redirections exceeded ».

WinHttpTrack

Он загружает первую страницу с перенаправлением на домашнюю страницу www.posterous.com вместо реального содержимого страницы.

Изменить: URL сайта, который я пытаюсь сделать резервную копию, это blog.safabyte.net

3 ответа3

1

Это сработало для меня:

wget -r -l inf -k -E -p -nc http://blog.safabyte.net/

Кажется, что использование -m включает -N (отметка времени), а Posterous не отправляет последние измененные заголовки, которые расстраивают wget, поэтому вместо этого я просто использовал -r -l inf напрямую.

Используемые параметры:

-r рекурсивный
-l inf бесконечной глубины
-k суффикс html файлов с .html
-E обновить сохраненные файлы со ссылками на локальные файлы
-p ресурсы загрузки страницы
-nc не перезагружать URL более одного раза

Эта команда по-прежнему не загружает ресурсы из других доменов, что означает, что она не получает изображения, поскольку они размещены в другом CDN.

1

Posterous.com поддерживает API, который может вам помочь. В частности, их http://posterous.com/api/reading API может быть полезным. Вы можете использовать его для получения файла XML, содержащего все ваши сообщения и их содержание.

Например, http://posterous.com/api/readposts?hostname=jasonpearce возвращает все 12 сообщений, которые я сделал в Posterous.

0

Удалось скачать как минимум весь html контент. Следующий код, кажется, загружает все страницы из блога (используя Wget 1.11.3 в Windows XP):

wget -mk http://blog.safabyte.net/*

Сообщения изображений еще не загружены. Похоже, что это, вероятно, потому что они хранятся в разных доменах.

HTML-контент находится на blog.safabyte.com/*, а изображения - на http://posterous.com/getfile/files.posterous.com/cheated-by-safabyte/ * и files.posterous.com.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .