gpt4 book ai didi

python - Pandas 数据框每天重新采样和计数事件

转载 作者:太空宇宙 更新时间:2023-11-04 04:22:01 24 4
gpt4 key购买 nike

我有一个带有时间索引的数据框。我可以对数据重新采样以获取(例如)每天的平均值,但是我也想获取每天的计数。这是一个示例:

import datetime
import pandas as pd
import numpy as np

dates = pd.date_range(datetime.datetime(2012, 4, 5, 11,
0),datetime.datetime(2012, 4, 7, 7, 0),freq='5H')

var1 = np.random.sample(dates.size) * 10.0
var2 = np.random.sample(dates.size) * 10.0
df = pd.DataFrame(data={'var1': var1, 'var2': var2}, index=dates)

df1=df.resample('D').mean()

我还想获得每天计数的第 3 列“计数”:

count
3
5
7

非常感谢!

最佳答案

使用Resampler.agg然后在列中展平 MultiIndex:

df1 = df.resample('D').agg({'var1': 'mean','var2': ['mean', 'size']}) 
df1.columns = df1.columns.map('_'.join)
df1 = df1.rename(columns={'var2_size':'count'})
print (df1)
var1_mean var2_mean count
2012-04-05 3.992166 4.968410 3
2012-04-06 6.843105 6.193568 5
2012-04-07 4.568436 3.135089 1

替代解决方案 Grouper :

df1 = df.groupby(pd.Grouper(freq='D')).agg({'var1': 'mean','var2': ['mean', 'size']}) 
df1.columns = df1.columns.map('_'.join)
df1 = df1.rename(columns={'var2_size':'count'})
print (df1)
var1_mean var2_mean count
2012-04-05 3.992166 4.968410 3
2012-04-06 6.843105 6.193568 5
2012-04-07 4.568436 3.135089 1

编辑:

r = df.resample('D')
df1 = r.mean().add_suffix('_mean').join(r.size().rename('count'))
print (df1)
var1_mean var2_mean count
2012-04-05 7.840487 6.885030 3
2012-04-06 4.762477 5.091455 5
2012-04-07 2.702414 6.046200 1

关于python - Pandas 数据框每天重新采样和计数事件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54290490/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com