gpt4 book ai didi

scala - PairRDD 的总和值

转载 作者:行者123 更新时间:2023-12-04 22:58:06 25 4
gpt4 key购买 nike

我有一个 RDD 类型:

dataset :org.apache.spark.rdd.RDD[(String, Double)] = MapPartitionRDD[26]

相当于 (Pedro, 0.0833), (Hello, 0.001828) ...
我想总结所有的值(value), 0.0833+0.001828..但我找不到合适的
解决方案。

最佳答案

考虑到您的输入数据,您可以执行以下操作:

// example
val datasets = sc.parallelize(List(("Pedro", 0.0833), ("Hello", 0.001828)))
datasets.map(_._2).sum()
// res3: Double = 0.085128
// or
datasets.map(_._2).reduce(_ + _)
// res4: Double = 0.085128
// or even
datasets.values.sum()
// res5: Double = 0.085128

关于scala - PairRDD 的总和值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36011464/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com