gpt4 book ai didi

apache-spark - Apache Spark 中 reduce 和 reduceByKey 的区别

转载 作者:可可西里 更新时间:2023-11-01 14:14:56 24 4
gpt4 key购买 nike

Apache Spark 中的 reduce 和 reduceByKey 在功能上有什么区别?为什么 reduceByKey 是一个转换而 reduce 是一个 Action ?

最佳答案

这接近于 my answer explaining reduceByKey 的副本,但我将详细说明使两者不同的具体部分。但是,请参阅我的回答以了解有关 reduceByKey 内部结构的更多细节。

基本上,reduce 必须将整个数据集拉到一个位置,因为它正在减少到一个 最终值。另一方面,reduceByKey每个 键的一个值。由于此操作可以首先在每台机器上本地运行,因此它可以保留为 RDD,并对其数据集进行进一步的转换。

请注意,但是有一个 reduceByKeyLocally 可以用来自动将 Map 下拉到一个位置。

关于apache-spark - Apache Spark 中 reduce 和 reduceByKey 的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47934934/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com