是否可以从http://host/foo/bar/baz/index.cgi?page = 1开始并递归获取http:// host/foo /下的任何内容?(无法从http:// host/foo /开始,因为那不是一个有效页面.)我查看了各种选项来控制wget递归提取,例如--no-parent和--include-directories,但是我似乎无法找到完成上述操作的选项,例如一个简单的URL子字符串过滤器.
结果--include-directories 确实做我想做的事 - 我只是没有正确使用它.我应该做的:
wget --include-directories /foo 'http://host/foo/bar/baz/index.cgi?page=1'
Run Code Online (Sandbox Code Playgroud)