gpt4 book ai didi

python - 在 pandas df 中每 15 分钟 Groupby 值

转载 作者:太空宇宙 更新时间:2023-11-04 09:31:55 24 4
gpt4 key购买 nike

我正在尝试将 pandas df 中的值分组以用于关闭时间。具体来说,我每 15 分钟返回一次值。我可以使用以下方法来做到这一点。但我希望为每 15 分钟的片段返回值,即使值没有出现在 df 中也是如此。对于这些段,我将生成一个 ffill(),其中先前的值将分配给该段。

import pandas as pd

d = ({
'Time' : ['0/1/1900 8:00:00','0/1/1900 9:59:00','0/1/1900 10:00:00','0/1/1900 12:29:00','0/1/1900 12:30:00','0/1/1900 13:00:00','0/1/1900 13:02:00','0/1/1900 13:15:00','0/1/1900 13:20:00','0/1/1900 18:10:00','0/1/1900 18:15:00','0/1/1900 18:20:00','0/1/1900 18:25:00','0/1/1900 18:45:00','0/1/1900 18:50:00','0/1/1900 19:05:00','0/1/1900 19:07:00','0/1/1900 21:57:00','0/1/1900 22:00:00','0/1/1900 22:30:00','0/1/1900 22:35:00','1/1/1900 3:00:00','1/1/1900 3:05:00','1/1/1900 3:20:00','1/1/1900 3:25:00'],
'People' : [1,1,2,2,3,3,2,2,3,3,4,4,3,3,2,2,3,3,4,4,3,3,2,2,1],
})

df = pd.DataFrame(data = d)

df['Time'] = ['/'.join([str(int(x.split('/')[0])+1)] + x.split('/')[1:]) for x in df['Time']]
df['Time'] = pd.to_datetime(df['Time'], format='%d/%m/%Y %H:%M:%S')

df = df.groupby(df.Time.dt.floor('15T'))['People'].max()
print(df)

Time
1900-01-01 08:00:00 1
1900-01-01 09:45:00 1
1900-01-01 10:00:00 2
1900-01-01 12:15:00 2
1900-01-01 12:30:00 3
1900-01-01 13:00:00 3
1900-01-01 13:15:00 3
1900-01-01 18:00:00 3
1900-01-01 18:15:00 4
1900-01-01 18:45:00 3
1900-01-01 19:00:00 3
1900-01-01 21:45:00 3
1900-01-01 22:00:00 4
1900-01-01 22:30:00 4
1900-01-02 03:00:00 3
1900-01-02 03:15:00 2

本系列仅提供存在于 df 中的组。是否可以通过前一组的前向填充来确定每 15 分钟段的值。是否可以更改以下函数以为这些段赋值?

df = df.groupby(df.Time.dt.floor('H'))['People'].max()

最佳答案

如果你想groupby你需要Grouper

df.groupby(pd.Grouper(freq='15T',key='Time'))['People'].max().ffill()

关于python - 在 pandas df 中每 15 分钟 Groupby 值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55409895/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com