我目前正在尝试镜像一个网站。wget似乎很好地完成了这项工作,但是它在某些页面上不起作用。
查看手册,命令
wget -r https://www.gnu.org/
Run Code Online (Sandbox Code Playgroud)
应该下载GNU页面。它确实做到了。但是,如果我使用另一个页面,例如我个人网站的起始页面,这将不再起作用。
wget -r https://my-personal.website
Run Code Online (Sandbox Code Playgroud)
在index.html被下载,但没有的CSS / JS更不用说递归下载。下载的只是index.html.
我已经尝试使用该-U选项设置用户代理,但这也无济于事。是否缺少导致 wget 在 之后停止的选项index.html?
更新:我也尝试过该--mirror选项,该选项也不起作用并显示相同的行为。