gpt4 book ai didi

python - 'GroupedData' 对象在 Spark 数据帧中执行透视时没有属性 'show'

转载 作者:行者123 更新时间:2023-12-04 11:17:23 24 4
gpt4 key购买 nike

我想旋转一个 spark 数据框,我引用 pyspark documentation ,并基于 pivot函数,线索是.groupBy('name').pivot('name', values=None) .这是我的数据集,

 In[75]:  spDF.show()
Out[75]:

+-----------+-----------+
|customer_id| name|
+-----------+-----------+
| 25620| MCDonnalds|
| 25620| STARBUCKS|
| 25620| nan|
| 25620| nan|
| 25620| MCDonnalds|
| 25620| nan|
| 25620| MCDonnalds|
| 25620|DUNKINDONUT|
| 25620| LOTTERIA|
| 25620| nan|
| 25620| MCDonnalds|
| 25620|DUNKINDONUT|
| 25620|DUNKINDONUT|
| 25620| nan|
| 25620| nan|
| 25620| nan|
| 25620| nan|
| 25620| LOTTERIA|
| 25620| LOTTERIA|
| 25620| STARBUCKS|
+-----------+-----------+
only showing top 20 rows

然后我尝试旋转表名
In [96]:
spDF.groupBy('name').pivot('name', values=None)
Out[96]:
<pyspark.sql.group.GroupedData at 0x7f0ad03750f0>

当我试图向他们展示
In [98]:
spDF.groupBy('name').pivot('name', values=None).show()
Out [98]:

---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-98-94354082e956> in <module>()
----> 1 spDF.groupBy('name').pivot('name', values=None).show()
AttributeError: 'GroupedData' object has no attribute 'show'

不知道为什么 'GroupedData'无法显示,我该怎么做才能解决问题?

最佳答案

pivot()方法返回 GroupedData对象,就像 groupBy() .您不能使用 show()GroupedData对象之前没有使用聚合函数(例如 sum() 甚至 count() )。

this article想要查询更多的信息

关于python - 'GroupedData' 对象在 Spark 数据帧中执行透视时没有属性 'show',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51820994/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com