gpt4 book ai didi

python - Spark ;如何有效地减少值(value)

转载 作者:行者123 更新时间:2023-11-28 22:42:35 24 4
gpt4 key购买 nike

让我们考虑对 RDD:

x = sc.parallelize([("a", 1), ("b", 1), ("a", 4), ("c", 7)])

是否有更有效的替代方法:

x.map(lambda x: x[1]).reduce(lambda x, y: x+y)

为了找到所有值的总和

最佳答案

由于 x 是一个 PairRDD,您可以使用 values 方法而不是手动提取值:

x.values().sum()

关于python - Spark ;如何有效地减少值(value),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31537958/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com