gpt4 book ai didi

java - 为什么 Java Stream 生成器是无序的?

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:55:28 24 4
gpt4 key购买 nike

我尝试使用 Java Streams 并行化一些工作。让我们考虑这个简单的例子:

Stream.generate(new Supplier<Integer>() {
@Override
public Integer get() {
return generateNewInteger();
}
})
.parallel()
.forEachOrdered(new Consumer<Integer>() {
@Override
public void accept(Integer integer) {
System.out.println(integer);
}
});

问题是它不会为forEachOrdered 调用accept 方法,它只有在我使用forEach 时才有效。我想问题是 Stream.generate 在内部创建了 InfiniteSupplyingSpliterator ,它没有 ORDERED 特性。

问题是为什么?似乎我们知道数据生成的顺序。第二个问题是如何在生成流元素的并行流上执行forEachOrdered

最佳答案

最简单的答案是,Stream.generate 是无序的,因为 it’s specification这么说。

这并不是说如果实现尽可能按顺序处理项目,实际上恰恰相反。一旦一个操作被定义为无序的,只要有可能,实现就会尝试从无序的本质中获益。如果您在无序操作中遇到看起来像源顺序的事情,则可能没有办法从无序处理中获益,或者实现尚未使用所有机会。由于这可能会在未来版本或替代实现中发生变化,因此如果操作已指定为无序,则您不得依赖该顺序。

与有序的 Stream.iterate 相比,将 Stream.generate 定义为无序的意图可能会变得更加清晰。传递给 iterate 的函数将接收其前一个元素,因此元素之间存在前-后关系,因此是一种排序。通过 Stream.generate 的供应商没有收到前一个元素,换句话说,仅考虑功能签名时,与前一个元素没有关系。这适用于 Stream.generate(() -> constant)Stream.generate(Type::new) 之类的用例,但不适用于 Stream.generate (instance::statefulOp),这似乎不是预期的主要用例。如果操作是线程安全的并且您可以接受流的无序性质,它仍然有效。

你的例子一直没有进展的原因是 forEachOrdered 的实现实际上没有考虑无序性,而是尝试按照遇到顺序拆分后的 block 进行处理,即所有子-任务尝试缓冲它们的元素,以便一旦它们左侧的子任务完成,它们就可以将它们传递给操作。当然,缓冲和无限源不能一起很好地发挥作用,尤其是因为底层 InfiniteSupplyingSpliterator 将拆分为自己无限的子任务。原则上,有一个最左边的任务可以将其元素直接提供给操作,但该任务似乎在队列中的某个位置,等待被激活,这永远不会发生,因为所有工作线程都已经忙于处理另一个无限子-任务。最终,如果您让它运行足够长的时间,整个操作将因 OutOfMemoryError 而中断……

关于java - 为什么 Java Stream 生成器是无序的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42490328/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com