1

Я пытаюсь получить точную копию одной страницы. Я использую:

wget -E -H -k -K -p http://example.com

Все работает хорошо, кроме:

  1. Если в моем стиле есть импорт другого файла CSS, он не загружается.
  2. Если JavaScript размещает изображения в любом месте, то они не загружаются (поместите класс в тег привязки, а затем в моем файле script.js jQuery поместите туда изображение.

Есть идеи, как заставить кого-то из них работать?

1 ответ1

0

Я использую pavuk для зеркалирования, и оно прекрасно работает - полученное зеркало можно просмотреть в браузере, а также частично анализирует javascript (но, конечно, не полностью):

/usr/bin/pavuk -enable_js -fnrules F '*.php?*' '%o.php' -tr_str_str '?' '_questionmark_' -norobots -dont_limit_inlines -dont_leave_site http://www.example.com/ >OUT 2>ERR &

Вы также можете использовать -skip_url_rpattern, чтобы пропустить некоторые ненужные динамические сценарии из зеркала, например:

-skip_url_rpattern 'index.php\?Addcomm=' -skip_url_rpattern 'index.php\?cal=1'

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .