gpt4 book ai didi

python - 为什么 pandas 在聚合不存在的列时给出 NaN 列值?

转载 作者:行者123 更新时间:2023-11-30 23:23:34 27 4
gpt4 key购买 nike

我想要下面的 DataFrame 中按字母排列的数字总和:

In [10]: df
Out[10]:
letter number
0 A 1
1 A 2
2 B 3
3 B 4
4 C 5
5 C 6

[6 rows x 2 columns]

这真的很容易实现:

In [11]: df.groupby('letter')[['number']].sum()
Out[11]:
number
letter
A 3
B 7
C 11

[3 rows x 1 columns]

但是如果我拼写错误我的列,我会得到 NaN 值:

In [12]: df.groupby('letter')[['numberrrrr']].sum()
Out[12]:
numberrrrr
letter
A NaN
B NaN
C NaN

[3 rows x 1 columns]

这导致我们的团队竭尽全力确定错误所在。相反,我们想要一个错误声明,例如:

In [13]: df.groupby('letter')['numberrrrr'].sum()
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input-13-8ebcdeee8710> in <module>()
----> 1 df.groupby('letter')['numberrrrr'].sum()

/usr/local/Anaconda/lib/python2.7/site-packages/pandas/core/groupby.pyc in __getitem__(self, key)
2475 else:
2476 if key not in self.obj: # pragma: no cover
-> 2477 raise KeyError(str(key))
2478 # kind of a kludge
2479 return SeriesGroupBy(self.obj[key], selection=key,

KeyError: 'numberrrrr'

当请求的列丢失时,从聚合返回 DataFrame 不会导致错误,是否有任何特殊原因?

这是在 pandas 0.13.1 上。

最佳答案

这已在 master/0.14.0 中修复(周末发布); rc1 是 here如果你想尝试

In [7]: df.groupby('letter')[['number']].sum()
Out[7]:
number
letter
A 3
B 7
C 11

In [8]: df.groupby('letter')[['numberrrr']].sum()
KeyError: "Columns not found: 'numberrrr'"

In [9]: pd.__version__
Out[9]: '0.14.0rc1-43-g0dec048'

关于python - 为什么 pandas 在聚合不存在的列时给出 NaN 列值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23895305/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com