gpt4 book ai didi

groovy - 两个RDD之间的Apache Spark差异

转载 作者:行者123 更新时间:2023-12-02 05:28:16 25 4
gpt4 key购买 nike

说我有这个示例工作(在带有Java API的Groovy中):

def set1 = []
def set2 = []
0.upto(10) { set1 << it }
8.upto(20) { set2 << it }
def rdd1 = context.parallelize(set1)
def rdd2 = context.parallelize(set2)

//What next?

如何获得两个之间的差值的集合?我知道 union可以创建一个包含这些RDD中所有数据的RDD,但是我该怎么做呢?

最佳答案

如果只想设置一个减法,subtract将是一个答案。如果要“外部”集合,请尝试:

rdd1.subtract(rdd2).union(rdd2.subtract(rdd1))

关于groovy - 两个RDD之间的Apache Spark差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31275850/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com