gpt4 book ai didi

python - Pyspark Dataframe pivot 和 groupby 计数

转载 作者:太空宇宙 更新时间:2023-11-03 23:53:38 25 4
gpt4 key购买 nike

我正在处理如下所示的 pyspark 数据框

<表类="s-表"><头>id类别<正文>1一个1一个1B2B2一个3B3B3B

我想拆开类别列并计算它们的出现次数。所以,我想要的结果如下图所示

<表类="s-表"><头>idAB<正文>1212113为空3

我尝试在互联网上寻找可以帮助我的东西,但我找不到任何可以给我这个特定结果的东西。

最佳答案

简短版本,不必执行多个 groupBy

df.groupBy("id").pivot("category").count().show()

关于python - Pyspark Dataframe pivot 和 groupby 计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58557498/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com