标签: httrack

使用 wget 或 httrack 镜像存档网站时遇到问题

我正在尝试使用 wget 创建网站的本地镜像。但我发现我没有得到所有的链接页面。

这是网站

http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/

我不想要所有以 开头的页面web.archive.org,但我想要所有以 开头的页面http://web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/

当我使用时wget -r,在我的文件结构中我发现

web.archive.org/web/20110722080716/http://cst-www.nrl.navy.mil/lattice/index.html,
Run Code Online (Sandbox Code Playgroud)

但我没有属于这个数据库的所有文件,例如

web.archive.org/web/20110808041151/http://cst-www.nrl.navy.mil/lattice/struk/d0c.html.
Run Code Online (Sandbox Code Playgroud)

也许 httrack 会做得更好,但现在这太过分了。

那么,通过什么方式可以从Internet Archive Wayback Machine获取存档网站的本地副本

linux wget httrack webarchive

17
推荐指数
4
解决办法
1万
查看次数

有没有办法在 Firefox 中为页面添加书签并使其静态化?

我想让一些书签在 Firefox 中保持静态,但我找不到任何东西来做到这一点。

例子:

我为一个页面添加了书签,我想在 3 个月后查看它。但是如果它改变或消失了呢?我不想用 httrack 或其他东西保存页面,只需右键单击菜单项(设为静态/离线)或类似的。

firefox bookmarks httrack browser-addons

6
推荐指数
2
解决办法
239
查看次数

HTTrack 可以下载子目录吗?

我在网上发现了这个非常有用的工具 HTTrack,我想知道我是否可以下载一个子目录,而不是整个网站。例如,我不是下载 www.example.com 及其所有子目录,而是下载 www.example.com/sub/directory 及其所有子目录。

website download httrack

3
推荐指数
1
解决办法
4377
查看次数