Java Stream 生成的值多于限制集

Vik*_*nov 0 java iterator java-stream

出于某种原因,Java Stream 会生成更多的值(调用迭代器的 hasNext() 和 next() 方法。

这是合成示例。

我有一个迭代器形式的生成器:

@RequiredArgsConstructor
static class TestIterator implements Iterator<Integer> {
    private final int bound;
    private final Random rnd = new Random();

    private int current = 0;

    @Override public boolean hasNext() {
        return current < bound;
    }

    @Override public Integer next() {
        current = rnd.nextInt(20);
        System.out.println("Generated: " + current);
        return current;
    }
}
Run Code Online (Sandbox Code Playgroud)

现在,我正在尝试创建一个由几个迭代器组成的扁平流

public static void main(String... args) {

    List<Iterator<Integer>> iterators = asList(
        new TestIterator(18),
        new TestIterator(18),
        new TestIterator(18));
    Stream<Integer> streams = iterators.stream()
        .map(iter -> (Iterable<Integer>) () -> iter)
        .flatMap(iter -> StreamSupport.stream(iter.spliterator(), false)) // <-- Here the stream of streams is flatten to a single stream of integers and 'parallel' is set to false
        .limit(5); // <-- Here the limit is set

    streams.forEach(i -> System.out.println("***Consumed: " + i));
}
Run Code Online (Sandbox Code Playgroud)

而且,令我惊讶的是,输出如下:

Generated: 1
***Consumed: 1
Generated: 19
***Consumed: 19
Generated: 7
***Consumed: 7
Generated: 7
***Consumed: 7
Generated: 7
***Consumed: 7
Generated: 4
Generated: 3
Generated: 8
Generated: 14
Generated: 0
Generated: 16
Generated: 10
Generated: 3
Generated: 19
Run Code Online (Sandbox Code Playgroud)

因此,Stream 生成的结果比传递给 forEach 中的使用者的结果更多。即使它明确设置了'parallel = false'。

在我的实际场景中,hasNext() 和 next() 函数非常昂贵,它们从外部服务获取数据。

有人能解释一下如何在限制结果方面做得更好吗?

提前致谢。

geo*_*eze 5

这是一个已知的 JDK 错误,已在 JDK 10+ 中修复并反向移植到openjdk8u222,因此更新您的 Java 版本将解决该问题。