gpt4 book ai didi

python - Groupby 两列忽略对的顺序

转载 作者:行者123 更新时间:2023-12-01 13:17:14 24 4
gpt4 key购买 nike

假设我们有一个如下所示的数据框:

    start   stop   duration
0 A B 1
1 B A 2
2 C D 2
3 D C 0

构建以下列表的最佳方法是什么:i)开始/停止对; ii) 开始/停止对的计数; iii) 开始/停止对的平均持续时间?在这种情况下,顺序应该无关紧要: (A,B)=(B,A) .

所需输出: [[start,stop,count,avg duration]]
在本例中: [[A,B,2,1.5],[C,D,2,1]]

最佳答案

sort前两列(您可以就地执行此操作,或创建副本并执行相同的操作;我已经完成了前者),然后是 groupbyagg :

df[['start', 'stop']] = np.sort(df[['start', 'stop']], axis=1)

(df.groupby(['start','stop'])
.duration
.agg(['count', 'mean'])
.reset_index()
.values
.tolist())
# [['A', 'B', 2, 1.5], ['C', 'D', 2, 1.0]]

关于python - Groupby 两列忽略对的顺序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53662717/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com