从waybackmachine恢复旧网站

Dus*_*tin 26 archive data-recovery

有没有办法从waybackmachine恢复整个网站?

我有一个旧网站存档但不再有网站文件再次恢复它.有没有办法恢复旧数据,以便我可以恢复丢失的文件?

mgu*_*mon 47

wget是一个镜像整个站点的好工具,如果你在windows上,你可以使用Cygwin来安装它.以下命令将镜像站点:wget -m domain.name

来自评论的更新:

示例wget命令不会提升到父dir(-np),忽略robot.txt(-e robots=off),使用cdn domain(--domains=domain.name),并镜像一个url(镜像的url http://an.example.com).你得到的一切:

 wget -np -e robots=off --mirror --domains=staticweb.archive.org,web.archive.org http://web.archive.org/web/19970708161549/http://www.google.com/
Run Code Online (Sandbox Code Playgroud)

如果您正在处理https自签名证书,则可以使用它--no-check-certificate来禁用证书检查.wget帮助是查看可能选项的最佳位置.

  • + 1帮助**阻止递归爬行**!这应该是批准的答案. (2认同)