gpt4 book ai didi

pyspark:聚合字段的新列名

转载 作者:行者123 更新时间:2023-12-02 17:25:06 25 4
gpt4 key购买 nike

我有以下带有聚合函数的代码:

new_df = my_df.groupBy('id').agg({"id": "count", "money":"max"})

然后我的新列是 COUNT(id)MAX(money)。我可以自己指定列名而不是使用默认列名吗?例如。我希望它们被称为 my_count_idmy_max_money。我怎么做?谢谢!

最佳答案

使用列而不是字典:

>>> from pyspark.sql.functions import *
>>> my_df.groupBy('id').agg(count("id").alias("some name"), max("money").alias("some other name"))

关于pyspark:聚合字段的新列名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39256851/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com