我想从Google缓存中检索一个包含数千页的网站.有什么办法可以使用Google Cache或其他网络抓取工具/归档程序快速恢复吗?
我创建了一个免费服务来恢复您的网站,该网站可以从搜索引擎缓存中检索大多数页面.
该服务的输出是一个压缩文件,其中包含来自搜索引擎缓存的HTML.它仍然处于测试阶段,因此它仍然需要大量的调整和错误修正,但希望它可以帮助您或其他遇到相同问题的人.
更新:我没有时间继续开发服务,因此它已关闭.
小智 5
您可以使用site限制来查看Google(仍然)对网站的了解:
http://www.google.com/search?q=site:[domain]
Run Code Online (Sandbox Code Playgroud)
您也可以查看Internet Archive.
(在任何一种情况下,你可能都想做一些重型自动化来获取数千页.)