gpt4 book ai didi

apache-spark - 我们应该在 dataframe 上使用 groupBy 还是 reduceBy

转载 作者:行者123 更新时间:2023-12-02 02:55:47 25 4
gpt4 key购买 nike

<分区>

虽然groupBy apache 中的数据框会产生 Spark ,但随后会与数据框中的另一列进行聚合。有任何性能问题吗? reduceBy 是更好的选择吗?

df.groupBy("primaryKey").agg(max("another column"))

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com