gpt4 book ai didi

apache-spark - 依靠 spark Dataframe 的最佳方式是什么

转载 作者:行者123 更新时间:2023-12-04 05:29:56 26 4
gpt4 key购买 nike

在 spark Dataframe 上获得计数的最佳方法是什么?

1) 我试过 count 会添加一个 Action 。但我不想添加额外的操作。

2) 我在 RDD 上使用了累加器,为此数据帧需要转换为 RDD,甚至累加器也不准确。

我想知道spark已经足够成熟了,它没有任何其他方法。我认为一定有某种方法可以在不影响性能/运行时的情况下进行计数。

最佳答案

我觉得除了accumulator不加action没有别的办法了。要使用 accumulator 需要转换成 rdd。

关于apache-spark - 依靠 spark Dataframe 的最佳方式是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41473936/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com