为什么这个JavaScript代码在Node.js优化之后运行得更慢

Bri*_*ams 7 javascript optimization performance v8 node.js

当我遇到一个有趣的问题时,我正在使用JavaScript和Node.js创建一个ICPC问题的解决方案:在某些情况下,我的程序在同一数据集上的运行速度会慢两倍.

我把它剥离了,直到我得到这个演示行为的最小例子:

function solve(arr) {
  const total = arr.reduce((a, c) => a + c, 0);
  const count = arr.length;
  for (let i = 0; i < total; i++) {
    for (let j = 0; j < count; j++) {
      // calculate some stuff
    }
  }
}

for (let i = 0; i < 10; i++) {
  // generate some sample data (array of 5000 random numbers 1-10)
  const data = [];
  for (let i = 0; i < 5000; i++) {
    data.push(Math.floor(Math.random() * 10) + 1);
  }

  const start = new Date();
  solve(data);  // run solve on the data
  console.log(`${i + 1}: ${new Date() - start}ms`);
}
Run Code Online (Sandbox Code Playgroud)

这是node --trace-opt code.js使用Nodev10.15.1 运行的输出:

[marking 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> for optimized recompilation, reason: small function, ICs with typeinfo: 5/7 (71%), generic ICs: 0/7 (0%)]
[compiling method 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> using TurboFan OSR]
[optimizing 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> - took 1.453, 0.702, 0.082 ms]
1: 86ms
[marking 0x005062b82581 <JSFunction (sfi = 000001DA56AD8BD9)> for optimized recompilation, reason: hot and stable, ICs with typeinfo: 22/23 (95%), generic ICs: 1/23 (4%)]
[compiling method 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> using TurboFan]
[optimizing 0x005062b82521 <JSFunction solve (sfi = 000001DA56AD8CD9)> - took 0.159, 0.632, 0.096 ms]
2: 82ms
3: 80ms
[compiling method 0x005062b82581 <JSFunction (sfi = 000001DA56AD8BD9)> using TurboFan OSR]
[optimizing 0x005062b82581 <JSFunction (sfi = 000001DA56AD8BD9)> - took 0.592, 2.312, 0.154 ms]
4: 245ms
5: 243ms
6: 236ms
7: 237ms
8: 240ms
9: 246ms
10: 239ms
Run Code Online (Sandbox Code Playgroud)

在前三次迭代期间,运行时间大约为80ms,但就在第四次迭代之前,Node重新编译并优化一个方法,从那时起代码运行速度慢了大约3倍.

通常,Node运行时分析,重新编译和优化的时间运行得更快.

任何人都可以解释为什么Node在这种情况下优化使事情变得更糟糕?


请注意,如果将示例代码更改为total通过迭代计算而不是使用reduce优化,则可以按预期提高性能(运行时间降至约60ms):

let total = 0;
for (let v of arr) total += v;
Run Code Online (Sandbox Code Playgroud)

Bri*_*ams 1

我提交了一份错误报告并得到了Chromium开发人员的以下回复

一些数组内置函数使用分支提示进行循环边界检查,导致内联内置函数之后的所有代码都变成延迟代码。这对性能是不利的。

所以事实证明这是TurboFan编译器的一个已知问题,并且已经创建了修复程序并且当前正在测试:

此 CL 删除了提示,从而在微基准测试中将链接错误的代码调度提高了 3 倍。