Ale*_*Hou 0 java algorithm java-stream
有人告诉我 Java Stream 是处理大量数据的不错选择,我最近做了一个比较测试。然而测试结果却出人意料:
问题来自CodeWar:
假设有一个最初有100人的地铁,每一站都有几个人上车,也有几个人下车。目标是统计大量停靠站后留在地铁中的人数(100000)。
这是我的代码:
import java.util.ArrayList;
public class Metro1 {
private final static int STOPS = 100000;
private static ArrayList<int[]> metro = new ArrayList<int[]>();
public static int sum1() {
int sum = 0;
for(int[] x: metro) {
sum +=x[0] - x[1];
}
return sum;
}
public static int sum2() {
return metro.stream()
.mapToInt(x -> x[0]-x[1])
.sum();
}
public static void main(String[] args) {
long start=0;
long end = 0;
metro.add(new int[] {100,0});
for(int i=1;i<STOPS;i++) {
int in = (int) Math.round(Math.random() * 10);
int out = (int) Math.round(Math.random() * 10);
metro.add(new int[] {in,out});
}
System.out.println("Stops: " + metro.size());
start = System.currentTimeMillis();
System.out.println("sum1: " + sum1());
end = System.currentTimeMillis();
System.out.println("sum1 (for loop): " + String.valueOf(end-start) + " milliseconds.");
start = System.currentTimeMillis();
System.out.println("sum2: " + sum2());
end = System.currentTimeMillis();
System.out.println("sum1 (stream): " + String.valueOf(end-start) + " milliseconds.");
}
}
Run Code Online (Sandbox Code Playgroud)
我在 Eclipse 中运行代码,发现 sum1 比 sum2 快得多:
Stops: 100000
sum1: 79
sum1 (for loop): 6 milliseconds.
sum2: 79
sum1 (stream): 68 milliseconds.
Run Code Online (Sandbox Code Playgroud)
我以为代码很简单,但是为什么流比for循环慢?
谢谢,
亚历克斯
就像regexes特定的国产解析器可以更快一样,流可以提供快速而简洁的数据处理方法。流的优点之一是在处理元素时可以最小化中间数据结构。另一个是parallel评论中已经提到的方面。
但就你的例子而言。
至于你的结果,请尝试以下操作:
STOPS100_000_000return metro.stream().parallel()
.mapToInt(x -> x[0]-x[1])
.sum();这是我的结果Windows, quad core i7 laptop
Stops: 100000000
sum1: -7073
sum1 (for loop): 908 milliseconds.
sum2: -7073
sum1 (stream): 518 milliseconds.
Run Code Online (Sandbox Code Playgroud)