小编orl*_*lla的帖子

如何:在指定的时间间隔内从 Wayback Machine 下载页面

我的意思是在指定的时间段和间隔内从 Wayback Machine 下载可用的每个页面。例如,我想从 2012 年 1 月到 2012 年 12 月从 Nature.com 下载每天可用的每个页面。(这不完全是我想要做的,但已经足够接近了——并且提供了一个很好的例子。)

不幸的是,由于 Wayback 机器工作方式的独特性,wget 将无法工作。

Wayback Machine 下载器之类的工具似乎只能下载该页面的最新版本。

与 IA API 交互似乎是一条可行的途径,但我不确定这将如何运作。

谢谢!

webpage download wget

11
推荐指数
1
解决办法
4500
查看次数

标签 统计

download ×1

webpage ×1

wget ×1