gpt4 book ai didi

scala - 从另一个 RDD 中减去一个 RDD 无法正常工作

转载 作者:行者123 更新时间:2023-12-01 12:34:41 28 4
gpt4 key购买 nike

我想从另一个 RDD 中减去一个 RDD。我查看了文档,发现 subtract可以这样做。实际上,当我测试时 subtract , 最终的 RDD 保持不变,值不会被删除!

有没有其他功能可以做到这一点?或者我在使用 subtract不正确?

这是我使用的代码:

 val vertexRDD: org.apache.spark.rdd.RDD[(VertexId, Array[Int])]
val clusters = vertexRDD.takeSample(false, 3)
val clustersRDD: RDD[(VertexId, Array[Int])] = sc.parallelize(clusters)
val final = vertexRDD.subtract(clustersRDD)
final.collect().foreach(println(_))

最佳答案

通常不支持或至少不推荐使用可变类型(本例中为数组)执行诸如减法之类的集合操作。

尝试改用不可变类型。

我相信WrappedArray是用于将数组存储在集合中的相关容器,但我不确定。

关于scala - 从另一个 RDD 中减去一个 RDD 无法正常工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30830382/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com