gpt4 book ai didi

python - 在执行数据透视时从列值中获取列标题

转载 作者:行者123 更新时间:2023-12-03 23:43:58 25 4
gpt4 key购买 nike

我有一个如下所示的 DataFrame:

Customer    ProductCategory    TimeFrame    Sales    Returns
Greg Soap CY 5 1
Phil Towels PY 2 3
Greg Soap PY 7
Greg Towels CY 3
我想旋转这个 DataFrame 以便我得到这样的东西:
Customer    ProductCategory    Measure    CY    PY
Greg Soap Sales 5 7
Greg Soap Returns 1
Greg Towels Sales 3
Greg Towels Returns
Phil Towels Sales 2
Phil Towels Returns 3
上面的缺失值应该为空。我不想填满他们。
我尝试了一些不同的方法。我得到的最接近的是使用 pivot_table连同 melt , groupbystack :
pd.pivot_table(df, values=['Sales', 'Returns'], index=['Customer', 'ProductCategory'], columns=['TimeFrame'], aggfunc=np.sum) \
.reset_index() \
.melt(id_vars=['Customer', 'ProductCategory']) \
.rename(columns={None: 'Measure'}) \
.groupby(by=['Customer', 'ProductCategory', 'Measure', 'TimeFrame'])['value'] \
.aggregate('first') \
.unstack() \
.reset_index()
这导致以下结果:
TimeFrame   Customer    ProductCategory    Measure    CY    PY
0 Greg Soap Returns 1.0 0.0
1 Greg Soap Sales 5.0 7.0
2 Greg Towels Returns 0.0 NaN
3 Greg Towels Sales 3.0 NaN
4 Phil Towels Returns NaN 3.0
5 Phil Towels Sales NaN 2.0
这里的问题是一些空数值已用零填充。此外,即使我应用了 reset_index,索引现在也被命名为“TimeFrame”?
最后,我很好奇是否有更有效的方法来做到这一点,但我很想念。自 pivot_table让我大部分时间都在那里,是否有我遗漏的参数或类似的东西?

最佳答案

您只需要 meltpivot_table :

(df.melt(['Customer','ProductCategory','TimeFrame'], var_name='Measure')
.pivot_table(index=['Customer','ProductCategory','Measure'],
columns='TimeFrame',values='value')
.reset_index()
)
输出:
TimeFrame Customer ProductCategory  Measure   CY   PY
0 Greg Soap Returns 1.0 NaN
1 Greg Soap Sales 5.0 7.0
2 Greg Towels Sales 3.0 NaN
3 Phil Towels Returns NaN 3.0
4 Phil Towels Sales NaN 2.0
要删除索引/列的名称,将上面的内容与 rename_axis(index=None,columns=None) 链接起来

关于python - 在执行数据透视时从列值中获取列标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64068978/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com