gpt4 book ai didi

python - 如何使用基于numpy中日期的窗口获取时间序列的回顾移动平均值?

转载 作者:太空狗 更新时间:2023-10-30 01:21:10 25 4
gpt4 key购买 nike

我有这样的时间序列:

                  times | data
1994-07-25 15:15:00.000 | 165
1994-07-25 16:00:00.000 | 165
1994-07-26 18:45:00.000 | 165

1994-07-27 15:15:00.000 | 165
1994-07-27 16:00:00.000 | 165

1994-07-28 18:45:00.000 | 165
1994-07-28 19:15:00.000 | 63
1994-07-28 20:35:00.000 | 64
1994-07-28 21:55:00.000 | 64

1994-07-29 14:15:00.000 | 62

1994-07-30 15:35:00.000 | 62
1994-07-30 16:55:00.000 | 61

我想对这些数据做一个回溯移动平均,但是有一个基于日期的窗口,不是行或日期时间 .


例如,假设 lookback = 3 days,则为

1994-07-29 14:15:00.000 | 62

它的回溯移动平均值应该是

1994-07-26 18:45:00.000 | 165

1994-07-27 15:15:00.000 | 165
1994-07-27 16:00:00.000 | 165

1994-07-28 18:45:00.000 | 165
1994-07-28 19:15:00.000 | 63
1994-07-28 20:35:00.000 | 64
1994-07-28 21:55:00.000 | 64

因为是 3 天回溯,所以平均遗嘱将从 1994-07-26 开始持续 3 天,无论一天内有多少行。


此外,对于具有相同日期(不包括时间)的多行,它们的回溯移动平均值应该相同。


我怎样才能轻松实现这一点?

最佳答案

我会使用 Pandas DatetimeIndex累积每个日期的值。

然后您可以使用 rolling_mean计算您需要的平均值。

import numpy as np
import pandas
df = pandas.DataFrame({'times': np.array(['1994-07-25 15:15:00.000',
'1994-07-25 16:00:00.000',
'1994-07-26 18:45:00.000',
'1994-07-27 15:15:00.000',
'1994-07-27 16:00:00.000',
'1994-07-28 18:45:00.000',
'1994-07-28 19:15:00.000',
'1994-07-28 20:35:00.000',
'1994-07-28 21:55:00.000',
'1994-07-29 14:15:00.000',
'1994-07-30 15:35:00.000',
'1994-07-30 16:55:00.000'], dtype='datetime64'),
'data': [165,165,165,165,165,165,63,64,64,62,62,61]})
df = df.set_index('times')
g = df.groupby(df.index.date)
days = 3
pandas.rolling_mean(g.sum(), days)

这给出:

1994-07-25         NaN
1994-07-26 NaN
1994-07-27 275.000000
1994-07-28 283.666667
1994-07-29 249.333333
1994-07-30 180.333333

您可能希望在 rolling_mean 上使用 centermin_periods 参数来获得您想要的准确结果。

关于python - 如何使用基于numpy中日期的窗口获取时间序列的回顾移动平均值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33413155/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com