gpt4 book ai didi

python - 获取每小时每分钟的平均计数

转载 作者:太空宇宙 更新时间:2023-11-03 15:59:52 24 4
gpt4 key购买 nike

我有一个带有时间戳作为索引和一列标签的数据框

df=DataFrame({'time':[ datetime(2015,11,2,4,41,10),     datetime(2015,11,2,4,41,39), datetime(2015,11,2,4,41,47), 
datetime(2015,11,2,4,41,59), datetime(2015,11,2,4,42,4), datetime(2015,11,2,4,42,11),
datetime(2015,11,2,4,42,15), datetime(2015,11,2,4,42,30), datetime(2015,11,2,4,42,39),
datetime(2015,11,2,4,42,41),datetime(2015,11,2,5,2,9),datetime(2015,11,2, 5,2,10),
datetime(2015,11,2,5,2,16),datetime(2015,11,2,5,2,29),datetime(2015,11,2, 5,2,51),
datetime(2015,11,2,5,9,1),datetime(2015,11,2,5,9,21),datetime(2015,11,2,5,9,31),
datetime(2015,11,2,5,9,40),datetime(2015,11,2,5,9,55)],
'Label':[2,0,0,0,1,0,0,1,1,1,1,3,0,0,3,0,1,0,1,1]}).set_index(['time'])

我想获取标签在特定分钟内出现的平均次数在一个不同的时间。

例如,标签 0 在第 4 小时第 41 分钟出现 3 次,在第 4 小时出现 2 次第 42 分钟,
第 5 小时第 2 分钟内出现 2 次,第 5 小时第 9 分钟内出现 2 次,因此其平均计数为第 4 小时中的分钟是

(2+3)/2=2.5 

第 5 小时每分钟的计数为

(2+2)/2=2

我正在寻找的输出是

Hour 1
Label avg
0 2.5
1 2
2 .5
3 0


Hour 2
Label avg
0 2
1 1.5
2 0
3 1

到目前为止我所拥有的是

df['hour']=df.index.hour

hour_grp=df.groupby(['hour'], as_index=False)

然后我可以做类似的事情

res=[]
for key, value in hour_grp:
res.append(value)

然后按分钟分组

res[0].groupby(pd.TimeGrouper('1Min'))['Label'].value_counts()

但这就是我陷入困境的地方,更不用说它效率不高

最佳答案

首先将 DataFrame 压缩为一个系列(毕竟,它只有一列):

s = df.squeeze()

计算每个标签每分钟出现的次数:

counts_by_min = (s.resample('min')
.apply(lambda x: x.value_counts())
.unstack()
.fillna(0))

# 0 1 2 3
# time
# 2015-11-02 04:41:00 3.0 0.0 1.0 0.0
# 2015-11-02 04:42:00 2.0 4.0 0.0 0.0
# 2015-11-02 05:02:00 2.0 1.0 0.0 2.0
# 2015-11-02 05:09:00 2.0 3.0 0.0 0.0

按小时重新采样 counts_by_min 以获得每个标签按小时出现的次数:

counts_by_hour = counts_by_min.resample('H').sum()

# 0 1 2 3
# time
# 2015-11-02 04:00:00 5.0 4.0 1.0 0.0
# 2015-11-02 05:00:00 4.0 4.0 0.0 2.0

按小时计算每个标 checkout 现的分钟数:

minutes_by_hour = counts_by_min.astype(bool).resample('H').sum()

# 0 1 2 3
# time
# 2015-11-02 04:00:00 2.0 1.0 1.0 0.0
# 2015-11-02 05:00:00 2.0 2.0 0.0 1.0

将后两项相除即可得到您想要的结果:

avg_per_hour = counts_by_hour.div(minutes_by_hour).fillna(0)

# 0 1 2 3
# time
# 2015-11-02 04:00:00 2.5 4.0 1.0 0.0
# 2015-11-02 05:00:00 2.0 2.0 0.0 2.0

关于python - 获取每小时每分钟的平均计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40441631/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com