- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我明白 there is overhead in setting up并行 Stream
的处理,如果项目很少或每个项目的处理速度很快,则单线程中的处理速度更快。
但是,trySplit()
是否有类似的阈值? ,将问题分解成更小的 block 会适得其反吗?我正在类比最小块的合并排序切换到插入排序。
如果是这样,阈值是否取决于 trySplit()
和 consuming 的相对成本tryAdvance()
过程中的项目?考虑一个比推进数组索引复杂得多的拆分操作——例如,拆分一个按词法排序的多集排列。是否有约定让客户在创建并行流时指定拆分的下限,具体取决于消费者的复杂性? Spliterator
可以用来估计下限本身的启发式方法吗?
或者,让 Spliterator
的下限为 1 并让工作窃取算法负责选择是否继续拆分是否总是安全的?
最佳答案
通常,您不知道传递给 tryAdvance
或 forEachRemaining
的消费者完成了多少工作。流管道和 FJP 都不知道这一点,因为它取决于用户提供的代码。它可以比拆分过程快得多或慢得多。例如,您可能有两个元素的输入,但每个元素的处理需要一个小时,因此拆分此输入是非常合理的。
我通常会尽可能多地拆分输入。可以使用三个技巧来改进拆分:
如果很难均匀分割,但您可以跟踪(或至少粗略估计)每个子部分的大小,请随意不均匀分割。流实现将为更大的部分做更多的进一步拆分。不要忘记 SIZED
和 SUBSIZED
特性。
将拆分的困难部分移至下一个 tryAdvance
/forEachRemaining
调用。例如,假设您有已知数量的排列,并且在 trySplit
中您将跳转到其他排列。像这样:
public class MySpliterator implements Spliterator<String> {
private long position;
private String currentPermutation;
private final long limit;
MySpliterator(long position, long limit, String currentPermutation) {
this.position = position;
this.limit = limit;
this.currentPermutation = currentPermutation;
}
@Override
public Spliterator<String> trySplit() {
if(limit - position <= 1)
return null;
long newPosition = (position+limit)>>>1;
Spliterator<String> prefix =
new MySpliterator(position, newPosition, currentPermutation);
this.position = newPosition;
this.currentPermutation = calculatePermutation(newPosition); // hard part
return prefix;
}
...
}
将困难的部分移至下一个 tryAdvance
调用,如下所示:
@Override
public Spliterator<String> trySplit() {
if(limit - position <= 1)
return null;
long newPosition = (position+limit)>>>1;
Spliterator<String> prefix =
new MySpliterator(position, newPosition, currentPermutation);
this.position = newPosition;
this.currentPermutation = null;
return prefix;
}
@Override
public boolean tryAdvance(Consumer<? super String> action) {
if(currentPermutation == null)
currentPermutation = calculatePermutation(position); // hard part
...
}
这样困难的部分也将与前缀处理并行执行。
如果当前拆分器中剩余的元素不多(例如,少于 10 个)并且请求拆分,则最好只前进到一半的元素,将它们收集到数组中,然后创建此前缀的基于数组的拆分器(类似于它在 AbstractSpliterator.trySplit()
中的完成方式)。您可以在这里控制所有代码,因此您可以提前测量正常 trySplit
比 tryAdvance
慢多少,并估计何时应该切换到基于数组的拆分的阈值。
关于java - Spliterator 什么时候应该停止 split ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31974261/
我在想问题的答案:How to test for null keys on any Java map implementation? 我的第一个想法是检查 map 键集的 Spliterator 是否
在 Java 1.8.0_25 发布到荒野之后有一个有趣的情况......我相信我的问题的根源主要与接口(interface)中“默认”实现的新(到 1.8)特性有关。 我正在开发的应用程序目前的目标
我发现 Java 并行流有一些令人惊讶的行为。我自己制作了Spliterator ,并且生成的并行流被分割,直到每个流中只有一个元素。这似乎太小了,我想知道我做错了什么。我希望我可以设置一些特征来纠正
我对我的所有研究感到有点困惑。我有一个名为 TabularResultSet 的自定义界面(为了举例,我已经淡化了它)它遍历任何本质上是表格的数据集。它有一个类似于迭代器的 next() 方法,它可以
我遇到了流的 dropWhile 或 takeWhile 方法的问题,因为 spliterator 正在跳过特定模式奇数或偶数中的文本部分。应该怎样处理文本的所有部分?我的方法在这里: void re
https://docs.oracle.com/javase/8/docs/api/java/util/Spliterator.html SIZED Characteristic value sign
我正在玩 Java 8 Spliterator并创建了一个将斐波那契数字流式传输到给定的 n。所以对于斐波那契数列 0, 1, 1, 2, 3, 5, 8, ... n fib(n) -----
我想使用 Stream 并行处理一组未知数量的异构远程存储 JSON 文件(文件数量预先未知)。这些文件的大小差异很大,从每个文件 1 个 JSON 记录到某些其他文件中的 100,000 条记录。在
这可能是非常基本的,但我不是 Java 人。这是我的处理代码,它只是打印和 hibernate : private static void myProcessings(int value)
我正在查看 Spliterator 的文档,根据它,Spliterator 不是线程安全的: Despite their obvious utility in parallel algorithms,
我最近发现了一个错误 StreamSupport.intStream(/* a Spliterator.ofInt */, true) .limit(20) 调用 Spliterator.of
我在 java.util.Spliterator (Java 8) 中偶然发现了一个有趣的细节。 方法 trySplit() 应该返回 Spliterator 的实例或 null,如果它不能被拆分。
我明白 there is overhead in setting up并行 Stream 的处理,如果项目很少或每个项目的处理速度很快,则单线程中的处理速度更快。 但是,trySplit() 是否有类
stream.spliterator() 是否隐式关闭了 stream,还是之后需要显式关闭它? Stream stream = Stream.of("a", "b", "c"); Spliterat
在Collection的源代码中,我想知道为什么@Override使用注释。 spliterator()方法不是来自 Iterable ,和Object也没有。 public interface Co
我正在使用 Java 8 流。 当我使用 spliterator 添加到 map 时,出现重复键异常,但使用标准 for 循环不会引发异常。 // This works Map myMap = new
已结束。此问题正在寻求书籍、工具、软件库等的推荐。它不满足Stack Overflow guidelines 。目前不接受答案。 我们不允许提出寻求书籍、工具、软件库等推荐的问题。您可以编辑问题,以便
我读了一些关于如何创建有限的 Stream 的问题( Finite generated Stream in Java - how to create one? , How do streams sto
我将流拆分器直接用于我正在编写的库中的低级操作。最近,当我进行流拆分器和交错 tryAdvance/trySplit 调用时,我发现了非常奇怪的行为。这是演示问题的简单代码: import java.
我注意到使用 Guava 的 Iterables.partition(collection, partitionSize).spliterator() 生成的拆分器表现得很奇怪。 在生成的拆分器上执行
我是一名优秀的程序员,十分优秀!