python - groupby 后找不到 Grouper 名称 `datetime`-6ren

python - groupby 后找不到 Grouper 名称 `datetime`

转载作者：行者123 更新时间：2023-12-05 05:51:39

24

4

我有这个 Pandas 数据框

        datetime       machineID    errorID
0   2015-01-06 03:00:00     1   error3
1   2015-02-03 06:00:00     1   error4
2   2015-02-21 11:00:00     1   error1
3   2015-02-21 16:00:00     1   error2
4   2015-03-20 06:00:00     1   error1
5   2015-04-04 06:00:00     1   error5
6   2015-05-04 06:00:00     1   error4
7   2015-05-19 06:00:00     1   error2
8   2015-05-19 06:00:00     1   error3
9   2015-06-03 06:00:00     1   error5

现在我想拆开 errorID，这样我就可以获取基于 error1、error2...error5 的列。为此，我在 Pandas 中使用了 groupby 和 unstack 方法

a = errors.groupby(['machineID', 'datetime', 'errorID']).size().unstack('errorID', fill_value=0)

这给了我这个数据框

             errorID    error1  error2  error3  error4  error5
machineID   datetime                    
1   2015-01-06 03:00:00     0   0   1   0   0
    2015-02-03 06:00:00     0   0   0   1   0
    2015-02-21 11:00:00     1   0   0   0   0
    2015-02-21 16:00:00     0   1   0   0   0
    2015-03-20 06:00:00     1   0   0   0   0

现在我想根据 24H 频率和 datetime 对这些数据重新采样。但是当我使用 resample 函数时，它给我错误 KeyError: 'The grouper name datetime is not found'

a.resample('24H', on='datetime').agg({'error1':'mean','error2':'mean','error3':'mean','error4':'mean', 'error5':'mean'}).rename(columns={'error1':'error1_mean','error2' : 'error2_mean', 'error3': 'error3_mean', 'error4': 'error4_24mean','error5': 'error5_24mean'})

当我列出此数据框中的所有列时，它仅显示 ['error1', 'error2', 'error3', 'error4', 'error5']

这是整个错误

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-127-607c418305a0> in <module>
----> 1 a.resample('24H', on='datetime').agg({'error1':'mean','error2':'mean','error3':'mean','error4':'mean', 'error5':'mean'}).rename(columns={'error1':'error1_mean','error2' : 'error2_mean', 'error3': 'error3_mean', 'error4': 'error4_24mean','error5': 'error5_24mean'})

/anaconda/envs/azureml_py36/lib/python3.6/site-packages/pandas/core/generic.py in resample(self, rule, how, axis, fill_method, closed, label, convention, kind, loffset, limit, base, on, level)
   8447             base=base,
   8448             key=on,
-> 8449             level=level,
   8450         )
   8451         return _maybe_process_deprecations(

/anaconda/envs/azureml_py36/lib/python3.6/site-packages/pandas/core/resample.py in resample(obj, kind, **kwds)
   1304     """
   1305     tg = TimeGrouper(**kwds)
-> 1306     return tg._get_resampler(obj, kind=kind)
   1307 
   1308 

/anaconda/envs/azureml_py36/lib/python3.6/site-packages/pandas/core/resample.py in _get_resampler(self, obj, kind)
   1428 
   1429         """
-> 1430         self._set_grouper(obj)
   1431 
   1432         ax = self.ax

/anaconda/envs/azureml_py36/lib/python3.6/site-packages/pandas/core/groupby/grouper.py in _set_grouper(self, obj, sort)
    171             else:
    172                 if key not in obj._info_axis:
--> 173                     raise KeyError("The grouper name {0} is not found".format(key))
    174                 ax = Index(obj[key], name=key)
    175 

KeyError: 'The grouper name datetime is not found'

我不知道如何在 groupby 之后使用重采样

最佳答案

首先将值转换为日期时间:

errors['datetime'] = pd.to_datetime(errors['datetime'])

a = errors.groupby(['machineID', 'datetime', 'errorID']).size().unstack('errorID', fill_value=0)

然后如果需要对每个 machineID resample 使用:

a = a.reset_index(level=0).groupby('machineID').resample('24H').agg({'error1':'mean','error2':'mean','error3':'mean','error4':'mean', 'error5':'mean'}).rename(columns={'error1':'error1_mean','error2' : 'error2_mean', 'error3': 'error3_mean', 'error4': 'error4_24mean','error5': 'error5_24mean'})

或者如果只需要resample使用:

a = a.reset_index(level=0).resample('24H').agg({'error1':'mean','error2':'mean','error3':'mean','error4':'mean', 'error5':'mean'}).rename(columns={'error1':'error1_mean','error2' : 'error2_mean', 'error3': 'error3_mean', 'error4': 'error4_24mean','error5': 'error5_24mean'})

或者如果需要 groupby 和 Grouper 使用:

a = a.groupby(['machineID', pd.Grouper(freq='24H', level='datetime')]).agg({'error1':'mean','error2':'mean','error3':'mean','error4':'mean', 'error5':'mean'}).rename(columns={'error1':'error1_mean','error2' : 'error2_mean', 'error3': 'error3_mean', 'error4': 'error4_24mean','error5': 'error5_24mean'})

关于python - groupby 后找不到 Grouper 名称 `datetime`，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70346473/

24

4

0

文章推荐： javascript - 使用 formData axios 发布数据数组

文章推荐： webgl - 如何从 gltf 2.0 加载立方体并在纯 WebGL 中绘制它

文章推荐： node.js - node-sass 安装不允许的操作

grails - Cereal ，哥伦。按 parent 找 child ，按 child 找 parent
例如，我有一个父类Author: class Author { String name static hasMany = [ fiction: Book,
javascript - DOJO:找 child
代码如下: dojo.query(subNav.navClass).forEach(function(node, index, arr){ if(dojo.style(node, 'd
mysql - 加入两张 table 找 friend
我有一个带有 Id 和姓名的学生表和一个带有 Id 和 friend Id 的 Friends 表。我想加入这两个表并找到学生的 friend 。例如，Ashley 的 friend 是 Saman
grails - Grails按 child 找 parent
我通过互联网浏览，但仍未找到问题的答案。应该很容易: class Parent { String name Child child } 当我有一个 child 对象时，如何获得它的 paren
android - Firebase Android 找 friend 功能
我正在尝试创建一个以 Firebase 作为我的后端的社交应用。现在我正面临如何(在哪里？)找到 friend 功能的问题。我有每个用户的邮件地址。我可以访问用户的电话也预订。在传统的后端中，我
ios - Apple Game Center 和 Facebook 找 friend iOS6
我主要想澄清以下几点: 1。有人告诉我，在 iOS 5 及以下版本中，如果您使用 Game Center 设置多人游戏，则“查找 Facebook 好友”(如与好友争夺战)的功能不是内置的，因此您需要
docker - 有什么用!意思？找。\! -用户redis -exec chown redis '{}' +
关于redis docker镜像ENTRYPOINT脚本 docker-entrypoint.sh : #!/bin/sh set -e # first arg is `-f` or `--some-

首页

博学

6Ren·AI

商城

python - groupby 后找不到 Grouper 名称 `datetime`