java - 为什么在 Java 流中 flatMap() 之后的 filter() 是 "not completely"惰性的？-6ren

java - 为什么在 Java 流中 flatMap() 之后的 filter() 是 "not completely"惰性的？

转载作者：行者123 更新时间：2023-12-01 17:45:46

26

4

我有以下示例代码:

System.out.println(
       "Result: " +
        Stream.of(1, 2, 3)
                .filter(i -> {
                    System.out.println(i);
                    return true;
                })
                .findFirst()
                .get()
);
System.out.println("-----------");
System.out.println(
       "Result: " +
        Stream.of(1, 2, 3)
                .flatMap(i -> Stream.of(i - 1, i, i + 1))
                .flatMap(i -> Stream.of(i - 1, i, i + 1))
                .filter(i -> {
                    System.out.println(i);
                    return true;
                })
                .findFirst()
                .get()
);

输出如下:

1
Result: 1
-----------
-1
0
1
0
1
2
1
2
3
Result: -1

从这里我看到，在第一种情况下，stream 的行为确实很懒——我们使用 findFirst()，所以一旦我们有了第一个元素，我们的过滤 lambda 就不会被调用。然而，在使用 flatMap 的第二种情况下，我们看到尽管找到了满足过滤条件的第一个元素(它只是任何第一个元素，因为 lambda 总是返回 true)，但流的其他内容仍在被馈送通过过滤功能。

我试图理解为什么它的行为是这样的，而不是像第一种情况那样在计算第一个元素后放弃。任何有用的信息将不胜感激。

最佳答案

TL;DR，这个问题已在 JDK-8075939 中得到解决。并在 Java 10 中修复(并在 JDK-8225328 中向后移植到 Java 8)。

在研究实现 (ReferencePipeline.java) 时，我们看到方法 [ link ]

@Override
final void forEachWithCancel(Spliterator<P_OUT> spliterator, Sink<P_OUT> sink) {
    do { } while (!sink.cancellationRequested() && spliterator.tryAdvance(sink));
}

将调用findFirst操作。需要特别注意的是sink.cancellationRequested()，它允许在第一个匹配时结束循环。与[link比较]

@Override
public final <R> Stream<R> flatMap(Function<? super P_OUT, ? extends Stream<? extends R>> mapper) {
    Objects.requireNonNull(mapper);
    // We can do better than this, by polling cancellationRequested when stream is infinite
    return new StatelessOp<P_OUT, R>(this, StreamShape.REFERENCE,
                                 StreamOpFlag.NOT_SORTED | StreamOpFlag.NOT_DISTINCT | StreamOpFlag.NOT_SIZED) {
        @Override
        Sink<P_OUT> opWrapSink(int flags, Sink<R> sink) {
            return new Sink.ChainedReference<P_OUT, R>(sink) {
                @Override
                public void begin(long size) {
                    downstream.begin(-1);
                }

                @Override
                public void accept(P_OUT u) {
                    try (Stream<? extends R> result = mapper.apply(u)) {
                        // We can do better that this too; optimize for depth=0 case and just grab spliterator and forEach it
                        if (result != null)
                            result.sequential().forEach(downstream);
                    }
                }
            };
        }
    };
}

前进一项的方法最终会在子流上调用 forEach ，而没有任何提前终止的可能性，并且 flatMap 方法开头的注释甚至告诉我们关于这个缺失的功能。

由于这不仅仅是一个优化，因为它意味着当子流无限时代码会简单地中断，我希望开发人员很快证明他们“可以做得更好”......

<小时/>

为了说明其含义，虽然 Stream.iterate(0, i->i+1).findFirst() 按预期工作，但 Stream.of("").flatMap( x->Stream.iterate(0, i->i+1)).findFirst() 最终将陷入无限循环。

关于规范，大部分可以在中找到

chapter “Stream operations and pipelines” of the package specification :

…

Intermediate operations return a new stream. They are always lazy;

…

… Laziness also allows avoiding examining all the data when it is not necessary; for operations such as "find the first string longer than 1000 characters", it is only necessary to examine just enough strings to find one that has the desired characteristics without examining all of the strings available from the source. (This behavior becomes even more important when the input stream is infinite and not merely large.)

…

Further, some operations are deemed short-circuiting operations. An intermediate operation is short-circuiting if, when presented with infinite input, it may produce a finite stream as a result. A terminal operation is short-circuiting if, when presented with infinite input, it may terminate in finite time. Having a short-circuiting operation in the pipeline is a necessary, but not sufficient, condition for the processing of an infinite stream to terminate normally in finite time.

很明显，短路操作不能保证有限时间终止，例如当过滤器不匹配任何项目时，处理无法完成，但是通过简单地忽略操作的短路性质来不支持在有限时间内终止的实现远远超出了规范。

关于java - 为什么在 Java 流中 flatMap() 之后的 filter() 是 "not completely"惰性的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60867703/

26

4

0

文章推荐： java - 为什么我需要对对象数组中的特定引用进行强制转换？

文章推荐： iphone - 在实现文件中使用类别作为私有(private)方法？

文章推荐： java - Backstack中找不到从xml添加的 fragment

文章推荐： iphone - 自定义 float 小数点

Java 8 FlatMap - 在嵌套表单中添加项目并使用 FlatMap 检索对象
我有一个对象Foo，其中包含Bar列表。这些类的描述如下: class Foo { String name; List bars = new ArrayList(); Foo(
Javascript - 数组上的 flatMap 方法 - (flatMap 不是函数)
根据 Mozilla 开发者网站: flatMap() 方法首先使用映射函数映射每个元素，然后将结果展平到一个新数组中。它与 map 后跟深度为 1 的 flat 相同，但 flatMap 通常非常有
scala - flatMap(func) 与 flatMap(func(_))
我对无法找到该问题的现有问题感到非常惊讶。这是为什么，鉴于: val p: Int => Option[Int] = Some(_) List(1, 2, 3).flatMap(p) 我得到: :14
java - Optional.flatMap() 和 Stream.flatMap() 之间有什么区别
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 5 年前。 Improve th
java - 在 map().flatMap() 上使用单个 flatMap() 是否更好？
我想知道两种平面映射情况之间是否存在显着差异。案例 1: someCollection .stream() .map(CollectionElement::getAnotherCol
scala - 为什么 scala.util.Success.flatMap (Try.flatMap) 在应用其参数后再次使用 try-catch ？
以下是flatMap的定义取自 scala.util.Success。 final case class Success[+T](value: T) extends Try[T] { def fl
python - 相当于Python中的pySpark flatMap
我正在寻找一个函数来展平列表数组。首先，我在 RDD 系统上使用 Apach Spark 函数 flatMap 实现了我的解决方案，但我想在本地执行此操作。但是，我无法找到的等价物 samples
scala - flatMap 忽略结果
我想知道是否存在忽略 flatMap 中的结果的函数(在 scala 或 cat 中) .例如。 Some("ignore this").ignoreArgumentFlatMap(Some("res
scala flatMap 展平嵌套列表
我正在学习 Scala 并解决了 99 个 Scala 问题。对于以下练习: 展平嵌套列表结构。示例: scala> flatten(List(List(1, 1), 2, List(3, List(
Swift flatMap 链展开
当编译器进入无限循环时，是否有人遇到过使用此类 flatMap 链(或什至更长)的问题。 let what = Future.init { (promise) in promise(.succ
scala - 实现列表#flatMap
有没有更好的函数方式来写 flatMap ? def flatMap[A,B](list: List[A])(f: A => List[B]): List[B] = list.map(x =>
java - 如何懒惰地评估嵌套的 flatMap
我试图从两个中变出笛卡尔积潜在无限然后我通过 limit() 限制的流. 到目前为止，这(大约)是我的策略: @Test void flatMapIsLazy() { Stream.
Scala:带元组的 flatMap
为什么以下声明对 .map() 有效但不适用于 .flatMap() ? val tupled = input.map(x => (x*2, x*3)) //Compilation error:
haskell - flatmap 列表和可能
我正在寻找可以同时映射和展平 Lists 和 Maybes 的代码。我在 this topic 中发现了这样一个 flatMap 函数: flatMap :: (t -> [a]) -> [t] ->
Scala - Flatmap 一系列选项和可遍历
考虑在某些大小写匹配上编写的 flatMap。例如: list.flatMap( v => v match { case Cond1 => if(something) Some
kotlin - FlatMapping ListK和Option
我无法使用ListKOf平面映射T -> Option。例如 listOf(1,2,3).k().flatMap { i -> if (i % 2 == 0) Some(i) else None
kotlin - 带有toList的RxJava flatMap
有人可以解释我如何在RxJava中通过flatMap运算符传递onComplete信号吗？如果对flatMap运算符进行注释，则可以获取1到10的数字列表，这意味着toList将收到onComple
kotlin - flatmap 键列表和集合到对列表中
我正在做一个在线类(class)并误读了一个问题(这就是为什么我认为可以发布这个问题，因为答案与类(class)中的问题无关!)。 data class Trip( val drive
Kotlin flatmap 解压数据类列表
给定作为数据类的二维坐标列表 data class Point(val x: Int, val y:Int) val points: List 和 TornadoFX(Kotlin 中的 JavaFX
java - flatMap 需要不必要的转换
这个问题已经有答案了: What is the difference between .stream() and Stream.of? (5 个回答) 已关闭 3 年前。我有以下代码: List p

首页

博学

6Ren·AI

商城

java - 为什么在 Java 流中 flatMap() 之后的 filter() 是 "not completely"惰性的？