如何从HTML文件生成HAR文件?

Viv*_*rma 4 html pagespeed har

如果我使用wget,并从URL获取一个html文件.如何从该HTML文件生成HAR文件.

  1. 用于从html文件生成har文件的任何开源实现?
  2. 一旦生成了HAR文件,我就可以使用harlib从HAR文件中读取数据.

如果可能,请建议C,C++或Java实现.

igr*_*rik 5

HAR格式的主要目的是拥有许多工具可以使用和分析的标准HTTP跟踪格式.换句话说,它的原始意图主要是,对于性能分析,不是"归档"网页本身.

如果您使用wget,则会丢失99%的所有性能数据.要捕获必要的数据,您确实需要一个浏览器来执行请求,获取所有相关资源,保存所有计时器等.这将使您能够构建瀑布图等.

如果你需要在服务器上捕获这些数据,那么你可以使用pcap捕获TCP跟踪,然后将其转换为HAR,尽管你仍然需要一个实际解析HTML并请求所有子资源的客户端(pcap是只是在后台听).或者,您可以通过代理路由浏览器,并让它为您吐出一个HAR文件.

最后但同样重要的是,您可以通过其调试界面驱动浏览器并以此方式导出HAR文件.用于驱动Firefox的Java示例:https://github.com/Filirom1/browsermob-page-perf