gpt4 book ai didi

python - Pandas 如何在 agg 函数后展平列?

转载 作者:行者123 更新时间:2023-12-04 10:26:35 26 4
gpt4 key购买 nike

说我有一个 df:

data=[('a', 1), ('a', 1),('b', 1),('a', 3),('b', 2),('c', 1),('a', 2),('b', 3),('a', 2)]
df=df=pd.DataFrame(data, columns=['project', 'duration'])

# Then I made an aggregation:
df_agg=df.groupby('project').agg({'duration': ['median', 'mean']}).reset_index()

Out[11]:
project duration
median mean
0 a 2 1.8
1 b 2 2.0
2 c 1 1.0


In [12]: df_agg.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
(project, ) 3 non-null object
(duration, median) 3 non-null int64
(duration, mean) 3 non-null float64
dtypes: float64(1), int64(1), object(1)
memory usage: 152.0+ bytes

然而, df_agg不像普通的 DataFrame,因为列看起来像
元组 (duration, median) , 这样我就不能用 df[['median', 'mean']] 方便地获取列

我的问题是如何更改 df_agg到一个普通的 DataFrame,列扁平化?

最佳答案

df_agg数据框的列有一个 MultiIndex。只有这个必须被压平。

一个简单的方法是将其转换为列表和 join每个元素:

df_agg.columns = ['_'.join(col) for col in df_agg.columns]

它给:
  project_  duration_median  duration_mean
0 a 2 1.8
1 b 2 2.0
2 c 1 1.0

如果你愿意,你可以重命名列以获得更好的名称

关于python - Pandas 如何在 agg 函数后展平列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60616013/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com