使用 wget 镜像博客

Kos*_*los 9 wget mirroring

我正在尝试镜像博客,例如www.example.com,使用wget.

我将 wget 与以下选项一起使用(正确替换了 shell 变量):

wget -m -p -H -k -E -np \
    -w 1 \
    --random-wait \
    --restrict-file-names=windows \
    -P $folder \
    -Q${quota}m \
    -t 3 \
    --referer=$url \
    -U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
    -e robots=off \
    -D $domains
    -- $url
Run Code Online (Sandbox Code Playgroud)

该博客包含驻留在其他域中的图像。

即使我已指定-p选项(下载链接页面资产),除非我在-D选项中明确指定每个域,否则不会下载这些图像。

如果我省略该-D选项,则 wget 将跟踪外部的每个链接www.example.com并下载整个互联网。

是否可以wget只关注下面的每个链接www.example.com并下载每个页面所需的资产,无论这些资产是否驻留在同一个域中,而无需我明确指定每个域?

spa*_*rks 1

不,唯一的方法是使用 -D 或 --domains=[domain list] 指定您希望 wget 遵循的域(以逗号分隔列表的形式)