Jos*_* B. 6 linux url directory wget raspberry-pi
我正在尝试使用以下目录结构复制论坛主题:
第一个页面有一个这样的 URL:
https://some.site.com/foo/bar/threadNumber
Run Code Online (Sandbox Code Playgroud)
其余页面遵循以下格式:
https://some.site.com/foo/bar/threadNumber/page/2
https://some.site.com/foo/bar/threadNumber/page/3
https://some.site.com/foo/bar/threadNumber/page/*
Run Code Online (Sandbox Code Playgroud)
我正在使用命令:
wget --recursive --page-requisites --adjust-extension --no-parent --convert-links https://some.site.com/foo/bar/threadNumber
Run Code Online (Sandbox Code Playgroud)
这个命令可以复制任何单个 URL 就好了。但是,我想放在更高的目录中,并获取所有/page/*
文件。我不想要更高的目录,只想要较低的/page/
文件。我也--mirror
没有成功。
任何想法为什么这个命令不会降低下载其余页面的速度?
试试这个:
wget -nv --mirror --span-hosts --convert-links --adjust-extension --page-requisites --no-parent https://some.site.com/foo/bar/threadNumber
Run Code Online (Sandbox Code Playgroud)
此命令获取包含来自所有站点的所有元素的整个线程。--accept html,gif,png,jpg,jpeg
例如,您可以按类型限制它。