gpt4 book ai didi

python - Dataframe 上的多种操作

转载 作者:太空宇宙 更新时间:2023-11-03 16:22:44 25 4
gpt4 key购买 nike

我正在尝试按一列/两列进行分组,对第四列的值求和并在第五列中查找平均值。每个操作都写在单独的输出中。感觉连开始都有点棘手。

输入:无标题,超过 100k 行

StartTime, EndTime,Day,SumCount,UniqueCount
00:00:00,01:00:00,Mon,13534,594
01:00:00,02:00:00,Mon,16674,626
02:00:00,03:00:00,Mon,23736,671
03:00:00,04:00:00,Mon,16977,671
00:00:00,01:00:00,Tue,17262,747
01:00:00,02:00:00,Tue,19072,777
02:00:00,03:00:00,Tue,18275,785
03:00:00,04:00:00,Tue,13589,757
04:00:00,05:00:00,Tue,16053,735
05:00:00,06:00:00,Tue,11440,636

我想找到的是

  1. Groupby StartTimeEndTime 查找 SumCount 的总和以及 UniqueCount 的中位数
  2. Groupby DaySumCount 的总和以及 UniqueCount 的中位数

我不知道如何将两种类型的 groupby 放入一个程序中并获得两种不同的输出。

最佳答案

尝试:

df.groupby(['StartTime', 'EndTime']).agg({'SumCount': ['sum'],
'UniqueCount': {'median': lambda x: np.median(x).round(0)}})

enter image description here

或者:

df.groupby(['Day']).agg({'SumCount': ['sum'],
'UniqueCount': {'median': lambda x: np.median(x).round(0)}})

enter image description here

关于python - Dataframe 上的多种操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38271612/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com