gpt4 book ai didi

scala - 在spark中将一行附加到一对RDD

转载 作者:行者123 更新时间:2023-12-04 01:51:20 24 4
gpt4 key购买 nike

我有一对现有值的 RDD,例如:(1,2)(3,4)(5,6)

我想追加一行 (7,8) 到同一个 RDD

如何在 Spark 中附加到同一个 RDD?

最佳答案

您可以使用联合操作。

scala> val rdd1 = sc.parallelize(List((1,2), (3,4), (5,6)))
q: org.apache.spark.rdd.RDD[(Int, Int)] = ParallelCollectionRDD[1] at parallelize at <console>:24

scala> val rdd2 = sc.parallelize(List((7, 8)))
q: org.apache.spark.rdd.RDD[(Int, Int)] = ParallelCollectionRDD[1] at parallelize at <console>:24

scala> val unionOfTwo = rdd1.union(rdd2)
res0: org.apache.spark.rdd.RDD[(Int, Int)] = UnionRDD[2] at union at <console>:28

关于scala - 在spark中将一行附加到一对RDD,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52886658/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com