Я хотел бы рекурсивно отразить веб-страницу, но она использует ссылки javascript, такие как "javascript:readArticle(x)"
. Я знаю, что такие ссылки просто переводятся в URL, скажем "/articles/read?id=x"
, могу ли я попросить wget" перевести "эти ссылки перед продолжением загрузки?
Я не предлагаю, чтобы wget интерпретировал JavaScript.
Есть ли способ, чтобы wget загрузил страницу, изменил эти ссылки (возможно, используя sed
?), А затем возобновил загрузку по новым ссылкам?