转换下载网站的链接

Cod*_*ict 5 wget

我使用以下方法下载了一个网站:

wget -c --mirror -p http://www.somewebsite.com
Run Code Online (Sandbox Code Playgroud)

对于离线查看,我只记得我忘记了 --convert-links 选项!它们现在都在我的硬盘上。有没有办法在不重新下载整个网站的情况下执行 --convert-links ?

ale*_*lex 8

简单的一个:使用类似SimpleHTTPServer 的东西为本地目录提供服务,然后wget使用适当的选项从 localhost重新启动。

  • 我应该添加一个大喊编辑 `/etc/hosts` 来伪造 localhost 作为被镜像的网站。只有当所有链接都指向同一个网页(即没有热链接图像)时,这才会有效。 (2认同)

tsh*_*ang 3

另外,不要忘记使用选项--timestamping,或添加timestamping=on到“ ~/.wgetrc ”。它确保当您重新镜像网站时,不会重新下载整个网站,而只会重新下载更改/新的文件。请参阅时间戳部分有关更多信息,请参阅 wget 联机帮助页中的

FWIW我用它来镜像我的博客:

wget --mirror --adjust-extension --convert-links --no-cookies --timestamping http://example.com --output-file=log-blog