如何只镜像一个网站的一部分?

sub*_*sub 48 wget mirror

我无法得到镜像网站的一部分(根目录下的文件夹路径) - 它似乎只能在网站主页上工作.

我尝试了很多选项 - 这是一个例子

wget -rkp -l3 -np  http://somewebsite/subpath/down/here/
Run Code Online (Sandbox Code Playgroud)

虽然我只想镜像该URL下面的内容链接 - 我还需要下载不在该路径中的所有页面资产.

它似乎适用于主页(/)但我不能得到任何子文件夹.

Att*_*lio 84

使用--mirror(-m)和--no-parent(-np)选项,以及一些很酷的选项,如下例所示:

wget --mirror --page-requisites --adjust-extension --no-parent --convert-links
     --directory-prefix=sousers http://stackoverflow.com/users
Run Code Online (Sandbox Code Playgroud)

  • 要保存搜索wget手册的其他人,-p是--page-requisites,-P是--directory-prefix (24认同)
  • 正如其他可能碰到这个问题的人一样,其中最常下载的Windows 7 wget二进制文件似乎是来自sourceforge.net的gnuwin32软件包,但那些是wget-1.11,它们没有--adjust-extension功能.它显然只在wget-1.12中添加.因此,Windows 7用户可以从这里获得更新,更自包含的二进制文件(http://eternallybored.org/misc/wget/) (4认同)

nin*_*alj 18

我通常使用:

wget -m -np -p $url
Run Code Online (Sandbox Code Playgroud)

  • -p用于下载显示页面所需的所有内容。这样是否会覆盖显示页面所需的那些元素的-np? (2认同)