Я хочу сделать зеркало сайта, который имеет динамическую карту сайта в форме XML.
Конечно, я хочу, чтобы этот файл сайта загружался и обрабатывался так, как если бы это был HTML-файл.
Я попробовал флаг -F
для этого файла, но он не сработал, сказав, что он не нашел URL внутри файла.
В настоящее время я предполагаю, что это не будет работать таким образом (потому что wget не для xml), но хотел попросить убедиться, что я ничего не пропускаю.
Содержание xml выглядит так:
<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="http://MY_SITE/wp-content/plugins/google-sitemap-generator/sitemap.xsl"?><!-- sitemap-generator-url="http://www.arnebrachhold.de" sitemap-generator-version="4.0.8" -->
<!-- generated-on="June 11, 2017 6:05 pm" -->
<sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap>
<loc>http://MY_SITE/sitemap-misc.xml</loc>
<lastmod>2017-05-31T20:49:06+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://MY_SITE/sitemap-pt-post-2017-04.xml</loc>
<lastmod>2017-04-12T16:27:52+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://MY_SITE/sitemap-pt-post-2017-02.xml</loc>
<lastmod>2017-02-10T17:50:14+00:00</lastmod>
</sitemap>
[...]
</sitemapindex>
И каждая дочерняя карта тогда вроде:
<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="http://MY_SITE/wp-content/plugins/google-sitemap-generator/sitemap.xsl"?><!-- sitemap-generator-url="http://www.arnebrachhold.de" sitemap-generator-version="4.0.8" -->
<!-- generated-on="June 11, 2017 6:07 pm" -->
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url>
<loc>http://MY_SITE/32017-SOME_CONTENT/</loc>
<lastmod>2017-04-12T16:27:52+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://MY_SITE/32017-SOME_OTHER_CONTENT/</loc>
<lastmod>2017-04-12T16:24:25+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
</urlset>