如何将包含其所有元素(css,js,images,...)的网页快照保存到一个文件中

Vac*_*ndo 11 html javascript css http archive

如何以编程方式将包含其所有元素(css,js,images,...)的网页快照保存到一个文件中?

我需要定期存档一些网页.然而,仅仅保存他们的HTML代码是没用的 - 不仅因为图像缺失,而且因为esp.因为今天网页上缺少CSS可能会使网页变得无法辨认.

我记得像这样工作的.mht格式,但需要手动保存,这只是IE的一个功能.我相信有一个开源解决方案可以通过编程方式实现,但是尽管经过了数小时的搜索,我还是无法在网上找到它.

Zai*_*lid 9

在终端中使用 wget

wget -p -k http://www.example.com/
Run Code Online (Sandbox Code Playgroud)

它将克隆站点前端 html、css、js、svg 等,但不会按照要求复制到一个文件中。相反,它会重新创建整个文件夹结构

例如,如果文件夹结构www.example.com如下

 /css/*
 /js/*
 /index.html
Run Code Online (Sandbox Code Playgroud)

然后它会在本地创建相同的结构。

文档: https: //www.gnu.org/software/wget/manual/wget.html