gpt4 book ai didi

python - 使用 pivot_table 时应用不同的聚合函数

转载 作者:行者123 更新时间:2023-11-28 21:47:44 24 4
gpt4 key购买 nike

我有这个样本:

import pandas as pd
import numpy as np
dic = {'name':
['j','c','q','j','c','q','j','c','q'],
'foo or bar':['foo','bar','bar','bar','foo','foo','bar','foo','foo'],
'amount':[10,20,30, 20,30,40, 200,300,400]}
x = pd.DataFrame(dic)
x
pd.pivot_table(x,
values='amount',
index='name',
columns='foo or bar',
aggfunc=[np.mean, np.sum])

它返回这个:

enter image description here

我只想要突出显示的列。为什么我不能像这样在 aggfunc 参数中指定元组?

pd.pivot_table(x, 
values='amount',
index='name',
columns='foo or bar',
aggfunc=[(np.mean, 'bar'), (np.sum, 'foo')])

像这里一样使用 .ix (define aggfunc for each values column in pandas pivot table) 是唯一的选择吗?

最佳答案

我认为你不能为 aggfunc 参数指定元组,但你可以这样做:

In [259]: p = pd.pivot_table(x,
.....: values='amount',
.....: index='name',
.....: columns='foo or bar',
.....: aggfunc=[np.mean, np.sum])

In [260]: p
Out[260]:
mean sum
foo or bar bar foo bar foo
name
c 20 165 20 330
j 110 10 220 10
q 30 220 30 440

In [261]: p.columns = ['{0[0]}_{0[1]}'.format(col) if col[1] else col[0] for col in p.columns.tolist()]

In [262]: p.columns
Out[262]: Index(['mean_bar', 'mean_foo', 'sum_bar', 'sum_foo'], dtype='object')

In [264]: p[['mean_bar','sum_foo']]
Out[264]:
mean_bar sum_foo
name
c 20 330
j 110 10
q 30 440

关于python - 使用 pivot_table 时应用不同的聚合函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36114645/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com