我正在尝试在大修之前镜像一个相当大的网站(20,000 多页)。基本上,在切换到新的之前我需要一个备份,以防我们忘记了我们需要的东西(我们将有大约 1,000 页在发布时)。该站点在 CMS 上运行,我无法轻松从中提取可用数据,因此我尝试使用 wget 制作副本。
我的问题是 wget 似乎并没有真正转换链接,尽管命令中存在 --convert-links 或 -k 。我尝试了几种不同的标志组合,但我一直无法获得所需的输出。最近失败的尝试是:
nohup wget --mirror -k -l10 -PafscSnapshot --html-extension -R *calendar* -o wget.log http://www.example.org &
Run Code Online (Sandbox Code Playgroud)
我还包括了 --backup-converted 和 --convert-links 而不是 -k(这并不重要)。我已经在有和没有 -P 和 -l 的情况下完成了它,同样不,它们应该很重要。
结果仍然有链接的文件,如:
http://www.example.org/ht/d/sp/i/17770
Run Code Online (Sandbox Code Playgroud)