gpt4 book ai didi

python - Pandas 数据透视表排列没有聚合

转载 作者:行者123 更新时间:2023-12-02 02:25:40 24 4
gpt4 key购买 nike

我想在没有聚合的情况下对 pandas 数据框进行透视,而不是垂直显示透视索引列,而是想水平显示它。我尝试使用 pd.pivot_table 但我没有得到我想要的。

data = {'year': [2011, 2011, 2012, 2013, 2013],
'A': [10, 21, 20, 10, 39],
'B': [12, 45, 19, 10, 39]}

df = pd.DataFrame(data)
print df
A B year
0 10 12 2011
1 21 45 2011
2 20 19 2012
3 10 10 2013
4 39 39 2013

但我想要:

year      2011     2012      2013
cols A B A B A B
0 10 12 20 19 10 10
1 21 45 NaN NaN 39 39

最佳答案

您可以先通过cumcount为新索引创建列,然后 stackunstack :

df['g'] = df.groupby('year')['year'].cumcount()
df1 = df.set_index(['g','year']).stack().unstack([1,2])
print (df1)

year 2011 2012 2013
A B A B A B
g
0 10.0 12.0 20.0 19.0 10.0 10.0
1 21.0 45.0 NaN NaN 39.0 39.0

如果需要设置列名称,请使用 rename_axis (pandas 0.18.0 中的新功能):

df['g'] = df.groupby('year')['year'].cumcount()
df1 = df.set_index(['g','year'])
.stack()
.unstack([1,2])
.rename_axis(None)
.rename_axis(('year','cols'), axis=1)
print (df1)
year 2011 2012 2013
cols A B A B A B
0 10.0 12.0 20.0 19.0 10.0 10.0
1 21.0 45.0 NaN NaN 39.0 39.0

另一个解决方案 pivot ,但您需要按 swaplevel 交换列中 Multiindex 的第一级和第二级然后按 sort_index 排序:

df['g'] = df.groupby('year')['year'].cumcount()
df1 = df.pivot(index='g', columns='year')
df1 = df1.swaplevel(0,1, axis=1).sort_index(axis=1)
print (df1)
year 2011 2012 2013
A B A B A B
g
0 10.0 12.0 20.0 19.0 10.0 10.0
1 21.0 45.0 NaN NaN 39.0 39.0
print (df1)

year 2011 2012 2013
A B A B A B
g
0 10.0 12.0 20.0 19.0 10.0 10.0
1 21.0 45.0 NaN NaN 39.0 39.0

关于python - Pandas 数据透视表排列没有聚合,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38606393/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com