扩展 wget --page-requisites 的脚本?

Pek*_*kka 2 linux bash shell perl wget

我今天发布了一个非常相似的问题,但我想再次提出 wget/linux 焦点。我希望一切顺利。

我需要在 LAMP 堆栈上以编程方式创建网页的离线副本,最好使用 PHP。我需要 HTML 源代码、附加图像和 CSS 样式表。

我可以在命令行上运行东西,但不能安装新包。

我可以wget --page-requisites在要存档的页面上执行操作。这会下载我需要的所有内容,但它不会修改下载的 HTML 和 CSS 文件以指向存档文件。

我正在寻找一个扩展/Perl 脚本/shell 脚本,它修改下载的文档以指向下载的资源,或者可能是一个不同的、基于 Linux 的解决方案。我已经检查过,httrack似乎没有安装在服务器上(“whereis httrack”什么都不返回)。

小智 9

尝试以下--convert-links选项:

下载完成后,对文档中的链接进行转换,使其适合本地查看。这不仅会影响可见的超链接,还会影响链接到外部内容的文档的任何部分,例如嵌入的图像、样式表的链接、非 HTML 内容的超链接等。