gpt4 book ai didi

python - Pandas Groupby 返回平均但是!排除 NaN

转载 作者:行者123 更新时间:2023-12-01 03:39:37 25 4
gpt4 key购买 nike

所以我试图理解 pandas groupby 函数并减少我拥有的大型数据帧。这是一个例子:

                             A        B
2016-09-23 19:36:08+00:00 NaN 34.0
2016-09-23 19:36:11+00:00 NaN 33.0
2016-09-23 19:36:12+00:00 24.1 NaN
2016-09-23 19:36:14+00:00 NaN 34.0
2016-09-23 19:36:17+00:00 NaN 34.0
2016-09-23 19:36:20+00:00 NaN 34.0
2016-09-23 19:36:22+00:00 24.2 NaN
2016-09-23 19:36:23+00:00 NaN 34.0
2016-09-23 19:36:26+00:00 NaN 34.0
2016-09-23 19:36:29+00:00 NaN 34.0
2016-09-23 19:36:32+00:00 24.1 NaN
2016-09-23 19:36:33+00:00 NaN 34.0
2016-09-23 19:37:00+00:00 NaN 34.0
2016-09-23 19:37:02+00:00 24.1 NaN

所以我有2个数据系列“A”和“B”,它们以不同的速率采样,采样时间作为原始数据帧的索引。

我现在想按日期/小时/分钟对数据框的行进行分组,并返回每分钟数据的平均值。这里平均值应该忽略数据框中的缺失值。

例如,我会返回这样的内容:

                             A        B
2016-09-23 19:36:00+00:00 24 34.0
2016-09-23 19:37:00+00:00 24.1 33.0

是否可以使用内置的 pandas 函数来做到这一点?

最佳答案

我认为你需要resampleResampler.mean ,计算组的平均值,排除缺失值:

print (df.resample('1Min').mean())
A B
2016-09-23 19:36:00 24.133333 33.888889
2016-09-23 19:37:00 24.100000 34.000000

另一个使用groupby的解决方案:

print (df.groupby([pd.TimeGrouper('1Min')]).mean())
A B
2016-09-23 19:36:00 24.133333 33.888889
2016-09-23 19:37:00 24.100000 34.000000

关于python - Pandas Groupby 返回平均但是!排除 NaN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39838367/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com