我正在尝试使用 wget 创建网站的本地镜像。但我发现我没有得到所有的链接页面。
这是网站
http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/
我不想要所有以 开头的页面web.archive.org,但我想要所有以 开头的页面http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/。
当我使用时wget -r,在我的文件结构中我发现
web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/index.html,
Run Code Online (Sandbox Code Playgroud)
但我没有属于这个数据库的所有文件,例如
web.archive.org/web/20110808041151/http://cst-www.nrl.navy.mil/lattice/struk/d0c.html.
Run Code Online (Sandbox Code Playgroud)
也许 httrack 会做得更好,但现在这太过分了。
那么,通过什么方式可以从Internet Archive Wayback Machine获取存档网站的本地副本?