Java Stream 比 for 循环慢

Ale*_*Hou 0 java algorithm java-stream

有人告诉我 Java Stream 是处理大量数据的不错选择,我最近做了一个比较测试。然而测试结果却出人意料:

问题来自CodeWar:

假设有一个最初有100人的地铁,每一站都有几个人上车,也有几个人下车。目标是统计大量停靠站后留在地铁中的人数(100000)。

这是我的代码:

import java.util.ArrayList;

public class Metro1 {
    private final static int STOPS = 100000;
    private static ArrayList<int[]> metro = new ArrayList<int[]>();

    public static int sum1() {
        int sum = 0;
        for(int[] x: metro) {
            sum +=x[0] - x[1];
        }
        return sum;
    }

    public static int sum2() {
        return metro.stream()
                .mapToInt(x -> x[0]-x[1])
                .sum();
    }
    public static void main(String[] args) {
        long start=0;
        long end = 0;
        metro.add(new int[] {100,0});
        for(int i=1;i<STOPS;i++) {
            int in = (int) Math.round(Math.random() * 10);
            int out = (int) Math.round(Math.random() * 10);
            metro.add(new int[] {in,out});
        }
        System.out.println("Stops: " + metro.size());

        start = System.currentTimeMillis();
        System.out.println("sum1: " + sum1());
        end = System.currentTimeMillis();
        System.out.println("sum1 (for loop): " + String.valueOf(end-start) + " milliseconds.");


        start = System.currentTimeMillis();
        System.out.println("sum2: " + sum2());
        end = System.currentTimeMillis();
        System.out.println("sum1 (stream): " + String.valueOf(end-start) + " milliseconds.");

    }

}
Run Code Online (Sandbox Code Playgroud)

我在 Eclipse 中运行代码,发现 sum1 比 sum2 快得多:

Stops: 100000
sum1: 79
sum1 (for loop): 6 milliseconds.
sum2: 79
sum1 (stream): 68 milliseconds.
Run Code Online (Sandbox Code Playgroud)

我以为代码很简单,但是为什么流比for循环慢?

谢谢,

亚历克斯

WJS*_*WJS 5

就像regexes特定的国产解析器可以更快一样,流可以提供快速而简洁的数据处理方法。流的优点之一是在处理元素时可以最小化中间数据结构。另一个是parallel评论中已经提到的方面。

但就你的例子而言。

  • 仅仅依靠使用内部时钟的性能测试(即使我也这样做)并不是准确评估性能的最佳方法。使用Java Microbench Harness之类的工具进行测试。
  • 至于你的结果,请尝试以下操作:

    • 改成STOPS100_000_000
    • 将您的流修改为
      return metro.stream().parallel() .mapToInt(x -> x[0]-x[1]) .sum();

这是我的结果Windows, quad core i7 laptop

Stops: 100000000
sum1: -7073
sum1 (for loop): 908 milliseconds.
sum2: -7073
sum1 (stream): 518 milliseconds.

Run Code Online (Sandbox Code Playgroud)

  • 我仔细检查了我的代码,发现其中有一个错误。现在,使用parallel() 的流工作得更快,几乎与for 循环相同。再次感谢您提供的详细信息! (2认同)