gpt4 book ai didi

python - 在 Python 中对数据集进行分组

转载 作者:太空宇宙 更新时间:2023-11-04 05:27:16 25 4
gpt4 key购买 nike

我有 30 年的日常数据。我想计算 30 年来的平均每天。比如我有这样的数据

1/1/2036      0
1/2/2036 73.61180115
1/3/2036 73.77733612
1/4/2036 73.61183929
1/5/2036 73.75443268
1/6/2036 73.58483887
.........
12/22/2065 73.90600586
12/23/2065 74.38092804
12/24/2065 77.76309967

我要计算:

1/1/yyyy     ?
1/2/yyyy ?
1/3/yyyy ?
......
12/30/yyyy ?
12/31/yyyy ?

我用 Python 编写了一段代码,但它只计算第一个月的平均值。我的数据集是 10950 x 1,它将被转换为 365 x 1。以下是我的代码:

import pandas as pd

files=glob.glob('*2036-2065*rcp26*.csv*')
RO_act=pd.read_csv('Reservoir storage zones_sohom.csv',index_col=0,parse_dates=True)
for i, fl in enumerate(files):
df = pd.read_csv(fl, index_col=0,usecols=[0,78],parse_dates=True)
df1=df.groupby(pd.TimeGrouper(freq='D')).mean()

请帮忙

最佳答案

您可以将函数传递给 df.groupby,它将作用于索引以创建组。所以,对你来说,使用:

df.groupby(lambda x: (x.day,x.month)).mean()

关于python - 在 Python 中对数据集进行分组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38321102/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com