小编acr*_*man的帖子

wget 不转换链接

我正在尝试在大修之前镜像一个相当大的网站(20,000 多页)。基本上,在切换到新的之前我需要一个备份,以防我们忘记了我们需要的东西(我们将有大约 1,000 页在发布时)。该站点在 CMS 上运行,我无法轻松从中提取可用数据,因此我尝试使用 wget 制作副本。

我的问题是 wget 似乎并没有真正转换链接,尽管命令中存在 --convert-links 或 -k 。我尝试了几种不同的标志组合,但我一直无法获得所需的输出。最近失败的尝试是:

nohup wget --mirror -k -l10 -PafscSnapshot --html-extension -R *calendar* -o wget.log http://www.example.org &
Run Code Online (Sandbox Code Playgroud)

我还包括了 --backup-converted 和 --convert-links 而不是 -k(这并不重要)。我已经在有和没有 -P 和 -l 的情况下完成了它,同样不,它们应该很重要。

结果仍然有链接的文件,如:

http://www.example.org/ht/d/sp/i/17770
Run Code Online (Sandbox Code Playgroud)

website wget mirroring

8
推荐指数
2
解决办法
1万
查看次数

标签 统计

mirroring ×1

website ×1

wget ×1