gpt4 book ai didi

Python pandas 在滚动日期窗口中最常见的值

转载 作者:行者123 更新时间:2023-11-30 22:19:43 27 4
gpt4 key购买 nike

我有一个包含以下数据的 pandas 数据框,我想添加一个新列,对于每个日期,返回过去 3 天内最常出现的“weather_type”。如果结果是平局,我希望返回最近的“weather_type”。

d = {'date': ['17/02/2017', '18/02/2017', '19/02/2017', '20/02/2017', 
'21/02/2017', '22/02/2017'], 'precipmm': [1, 0, 3, 2, 7, 8], 'weather_type':
['rain', 'sun', 'rain', 'snow', 'snow', 'rain']}
df = pd.DataFrame(data=d)
df['date']=pd.to_datetime(df['date'], format='%d/%m/%Y')
df['rollingsum_precipmm']=df['precipmm'].rolling(window=3).sum()

我已经使用以下内容成功创建了一个新列,其中包含过去 3 天内“precipmm”的总和:

df['rollingsum_precipmm']=df['precipmm'].rolling(window=3).sum()

我怀疑答案是围绕这个展开的,但到目前为止我还无法找到解决方案。

一如既往地感谢任何帮助

科林

最佳答案

要获得滚动模式,您可以执行以下操作:

from scipy.stats import mode
df['precipmm'].rolling(window=7).apply(lambda x: mode(x)[0])

关于Python pandas 在滚动日期窗口中最常见的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49036237/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com