我使用以下方法下载了一个网站:
wget -c --mirror -p http://www.somewebsite.com
Run Code Online (Sandbox Code Playgroud)
对于离线查看,我只记得我忘记了 --convert-links 选项!它们现在都在我的硬盘上。有没有办法在不重新下载整个网站的情况下执行 --convert-links ?
简单的一个:使用类似SimpleHTTPServer 的东西为本地目录提供服务,然后wget
使用适当的选项从 localhost重新启动。
另外,不要忘记使用选项--timestamping
,或添加timestamping=on
到“ ~/.wgetrc ”。它确保当您重新镜像网站时,不会重新下载整个网站,而只会重新下载更改/新的文件。请参阅时间戳部分有关更多信息,请参阅 wget 联机帮助页中的
FWIW我用它来镜像我的博客:
wget --mirror --adjust-extension --convert-links --no-cookies --timestamping http://example.com --output-file=log-blog