1

Я использую следующую команду для зеркалирования сайта:

wget -r -p -E -N -l 10 -k -nH -H -Dfoo.com,www.foo.com foo.com

У меня проблема в том, что где-то на foo.com есть ссылки на домены, заканчивающиеся на foo.com (например, newfoo.com), и wget также отражает этот сайт. Можно ли ограничить домены точным соответствием? Я не хочу сканировать никакие субдомены, кроме www.

1 ответ1

1

К сожалению, при сканировании сайта wget выполняет мягкое сопоставление с принятыми доменами. Например, все следующие домены будут соответствовать foo.com:

  • barfoo.com
  • bar.foo.com
  • anything.can.gohere.foo.com

Я на самом деле создал патч для wget 1.15, чтобы добавить опцию, чтобы включить это поведение строгого соответствия. При использовании этого патча весь домен должен точно совпадать. Это не влияет на другие списки доменов, такие как исключенные домены и т.д.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .