java - 在执行其他操作之前查找 Stream 大小-6ren

java - 在执行其他操作之前查找 Stream 大小

转载作者：搜寻专家更新时间：2023-10-30 19:57:39

24

4

在我的程序中，我重复¹ collect Java 8 streams将对象的集合减少为单个对象。此集合的大小在整个执行过程中可能变化很大:从 3 个对象到数百个对象。

public void findInterestingFoo(Stream<Foo> foos) {
    internalState.update(foos.collect(customCollector()));
}

在优化我的代码和寻找瓶颈的过程中，我做了流parallel在某一点。这在那个时间点奏效了，因为 Collection 品都相当大。后来，在改变程序的其他部分和参数后，集合变小了。我意识到不使流并行会更有效率。这是有道理的:为 4 个对象在多个线程上分配工作的开销根本不值得。不过，对于数百个对象来说，它是值得的。

如果我只能使大流并行，那将非常方便:

public void findInterestingFoo(Stream<Foo> foos) {
    if (isSmall(foos)) {
        internalState.update(foos.collect(customCollector()));
    } else {
        internalState.update(foos.parallel().collect(customCollector()));
    }
}

当然，当从 an array 创建流时，这可以手动完成, a collection , 或 manually .也就是说，我们知道流中有哪些元素，因此可以对其进行跟踪。然而，我有兴趣以通用方式解决这个问题，因此无论将哪种流传递给 findInterestingFoo，它都会得到适当且尽可能高效的处理。

类似于 count()可能有帮助，除了它在我可以之前终止流 collect

我很清楚流的设计没有固定大小，特别是:

Possibly unbounded. While collections have a finite size, streams need not. Short-circuiting operations such as limit(n) or findFirst() can allow computations on infinite streams to complete in finite time. — java.util.stream package description

不过，我想知道是否有任何方法可以在对其执行任何操作之前确定流中有多少元素。流真的不知道它是从有限集合创建的吗？

__________
_{¹ 数千次。在我的案例中，优化它使总运行时间从大约 1.5 秒加速到 0.5 秒。}

最佳答案

理论上，你可以这样做:

public void findInterestingFoo(Stream<Foo> foos) {
    Spliterator<Foo> sp = foos.spliterator();
    long size = sp.getExactSizeIfKnown();// returns -1 if not known
          // or sp.estimateSize(); // Long.MAX_VALUE means "unknown"
    internalState.update(
        StreamSupport.stream(sp, size > PARALLEL_THRESHOLD)
                     .collect(customCollector()));
}

spliterator()是消耗输入流的终端操作，但您可以通过 Spliterator至 StreamSupport.stream构造具有完全相同属性的流。第二个参数已经说明流是否应该并行。

理论上。

实际上，当前的流实现将根据流是否并行返回不同的Spliterator 实现。这意味着当原始流在调用 spliterator() 之前尚未并行时，将流重新创建为并行流可能会导致流无法进行并行处理。

但是，如果没有中间操作，例如当您直接传入从集合或数组创建的 Stream 时。

调用 parallel()在 spliterator() 之前获得一个支持并行的流，如果您决定这样做，它仍然可以按顺序运行，在很多情况下都有效。但是，如果输入流中有像 sorted() 这样的有状态中间操作，它们可能会固定为并行运行，即使您按顺序执行 collect(或反之亦然)。

另一个问题是基本性质的。元素的数量实际上并没有说明并行处理是否会有好处。这确实取决于每个元素的工作负载，这不仅取决于您的终端 collect 操作，还取决于在进入您的方法之前已经链接到流的操作。即使您断定收集器的工作负载已经足够高，值得并行处理，也可能是传入流具有类似 skip 的操作。 , limit或 distinct (在有序流上)，它通常并行运行更糟并且需要完全不同的阈值。

一个更简单的解决方案是让调用者决定，因为调用者知道流的大小和性质。您甚至不需要向方法的签名添加选项，因为调用者已经可以通过在传递之前调用流上的 parallel() 或 sequential() 来做出决定它到你的方法，你可以通过简单地不改变模式来尊重它。

关于java - 在执行其他操作之前查找 Stream 大小，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48380851/

24

4

0

文章推荐： objective-c - 10.10 通过TitleBar 的Source List？

文章推荐： java - 将父类成员仅限于其直接子类

文章推荐： java - 通过扫描文件系统查找直接和间接子类

文章推荐： java - 带有@EnableJpa*注解的Spring @WebMvcTest

macos - 执行 wine != 执行 `which wine`
我有一个“有趣”的问题，即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
javascript - CRONTAB 执行 Python，使用 puppeteer 执行 Node 来进行网页抓取不起作用
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出但令我惊讶的是，当我执行它时 */50 * * *
javascript - 对 javascript 函数的 Objective-C 调用何时被调用/执行，何时不被调用/执行？
JavaScript 是否被调用或执行取决于什么？准确地说，我有两个函数，它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
python - 为什么使用 statsmodels 执行 OLS 和使用 scikit 执行 PooledOLS 时会得到相同的结果？
我目前正在使用 python 做一个机器学习项目(这里是初学者，从头开始学习一切)。只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
c# - 通过 Enterprise Guide 执行 SAS 和从 .Net 执行 IOM 之间的区别
在使用集成对象模型 (IOM) 后，我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇，使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
javascript - jQuery 不会使用 animate : top 200px function. 执行，但它会使用 animate: height 执行
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示，但仍将高度添加到导航中以使其看起来好像要掉下来了。这个脚本工作正常: $(document).ready(funct
java - 为什么我的代码使用 'IF' 执行 'ELSE' 和 '==' ，但不使用 '.equals' 执行？
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。这里是 Java 新手，我正在使用 NetBeans 尝试一些简单的代
python - Keras 2.0.8 仅使用 Python 3.x 执行 1 个 epoch，使用 2.x 执行 10 个
如果我将它切换到 Python 2.x，它执行 10。这是为什么？训练逻辑回归模型 import keras.backend as
JavaScript 执行
我有两个脚本，它们包含在 HTML 正文中。在第一个脚本中，我初始化一个 JS 对象，该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
执行@number时的Java链接列表错误消息
每当我运行该方法时，我都会收到一个带有数字的错误以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
java - 执行 while 循环以显示菜单
我已经用 do~while(true) 创建了我的菜单；但是每次用户输入一个数字时，它不会运行程序，而是再次显示菜单!你怎么看？ //我的主要方法 public static void main(St
ipython - 执行/命令完成时通知
执行命令后，如何让IPython通知我？我可以使用铃声/警报还是通过弹出窗口获取它？我正在OS X 10.8.5的iTerm上运行Anaconda。最佳答案使用最新版本的iTerm，您可以在she
java - Swing 执行
您好，我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误，但 GUI 没有显示。这是我的源代码以供引用:
.net - 执行.NET应用程序时验证Authenticode签名
我觉得这里缺少明显的东西，但是我看不到它写在任何地方。我使用Authenticode证书对可执行文件进行签名，但是当我开始学习有关它的更多信息时，我对原样的值(value)提出了质疑。签名的exe
按钮单击事件上的 JavaScript 执行
我正在设计一个应用程序，它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作，为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
Haskell - 执行 while 循环
我是 Haskell 新手，如果有人愿意帮助我，我会很高兴!我试图让这个程序与 do while 循环一起工作。第二个 getLine 命令的结果被放入变量 goGlenn 中，如果 goGlenn
java - 执行 while 循环时出现问题
我有一个用 swing 实现迷你游戏的程序，在主类中我有一个循环，用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令，如果它是唯一的一条指令，我不知道为什么。
java - 执行.jar时将OJBDC添加到类路径
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序，它可以工作，但是当我尝试在 Windows 命令提示符中运行 .jar 时，
java future 执行
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行？当如下行创
java - 执行 && 最有效的方法？
我有一个常见的情况，您有两个变量(xSpeed 和 ySpeed)，当它们低于 minSpeed 时，我想将它们独立设置为零，并在它们都为零时退出。最有效的方法是什么？目前我有两种方法(方法2更干净

首页

博学

6Ren·AI

商城

java - 在执行其他操作之前查找 Stream 大小