gpt4 book ai didi

python - 比较不同数据帧的 groupby 输出

转载 作者:太空宇宙 更新时间:2023-11-03 15:00:27 24 4
gpt4 key购买 nike

比较多个 groupby 输出的方法是什么。

我有来自不同数据帧的多个 groupby 输出,如下所示

>>> tmp1
account place balance type
0 A A1 10 B1
1 A A1 20 B1
2 A A1 30 B1
3 A A1 10 B4
4 A A1 20 B4
5 A A1 10 B5
6 A A1 10 B6
7 B A2 10 B7
8 B A2 20 B1
9 B A2 100 B1

我愿意

    >>>tmp1.groupby(['account','place','type']['balance'].last().sum(level=0).astype(int)
account
A 70
B 110
Name: balance, dtype: int64

Similarly
>>> tmp2
account place balance type
0 A A1 100 B1
1 A A1 200 B1
2 A A1 100 B1
3 A A1 100 B4
4 A A1 200 B4
5 A A1 100 B5
6 A A1 100 B6
7 B A2 100 B7
8 B A2 200 B1
9 B A2 200 B1


>>>tmp2.groupby(['account','place','type']['balance'].last().sum(level=0).astype(int)
account
A 500
B 300
Name: balance, dtype: int64

#similarly tmp3 grouped..and so on

有没有办法找到余额最大的 df。例如。在这种情况下 tmp2 具有更大的总和 (70+110 < 500+300) .

我的尝试:我尝试的方法之一是求和并维护一个列表,如下所示

mylist=[]
mylist.append(tmp1.groupby(['account','place','type']['balance'].last().sum(.astype(int))
mylist.append(tmp2.groupby(['account','place','type']['balance'].last().sum(.astype(int))
>>> mylist
[180,800]

现在我可以从列表中获取最大值,但我丢失了帐户信息(最大值为 800,但我需要帐户 A 有 500 个、B 有 300 个的信息)

我试过了

>>>tmp2.groupby(['account','place','type'])['balance'].last().sum(level=0).to_dict()
{'A': 500, 'B': 300}

因此,对于每个 df 我都有一个字典,我只需要找到最多这样的列表(我认为我已经非常接近解决它)

我打算找到哪个数据框具有最大总和(以及帐户)

最佳答案

如果我理解正确的话,万一你有超过 2 个 dfs。

tmp1 = pd.DataFrame([{'acount':'A', 'balance':100, 'type':'A1'},
{'acount':'A', 'balance':200, 'type':'A2'},
{'acount':'B', 'balance':200, 'type':'B1'},
{'acount':'B', 'balance':300, 'type':'B2'}])
tmp2 = pd.DataFrame([{'acount':'A', 'balance':100, 'type':'A1'},
{'acount':'A', 'balance':200, 'type':'A2'},
{'acount':'B', 'balance':400, 'type':'B1'},
{'acount':'B', 'balance':300, 'type':'B2'}])
tmplist = [tmp1,tmp2]
tmprlist = [tmp.groupby(['acount','type']).last().sum(level=0).astype(int) for tmp in tmplist]
tmpslist = [tmp.groupby(['acount','type'])['balance'].last().sum() for tmp in tmplist]
tmprlist[np.argmax(tmpslist)]

结果:

acount  balance
A 300
B 700

关于python - 比较不同数据帧的 groupby 输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45161384/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com