作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
data.groupby(by="DAY").agg({"CLOSING_DATE": min})
当我尝试对数据框进行分组以获取稀疏列的最旧日期(CLOSING_DATE 大部分为空)时,为什么会出现以下错误?
Traceback (most recent call last):
File "<ipython-input-23-37f9fe161304>", line 1, in <module>
data[:10000].groupby(by="DAY").agg({"CLOSING_DATE": min})
File "/home/user/miniconda3/envs/churn/lib/python3.8/site-packages/pandas/core/groupby/generic.py", line 951, in aggregate
result, how = self._aggregate(func, *args, **kwargs)
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/base.py", line 416, in _aggregate
result = _agg(arg, _agg_1dim)
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/base.py", line 383, in _agg
result[fname] = func(fname, agg_how)
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/base.py", line 367, in _agg_1dim
return colg.aggregate(how)
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/groupby/generic.py", line 252, in aggregate
return getattr(self, cyfunc)()
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/groupby/groupby.py", line 1553, in min
return self._agg_general(
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/groupby/groupby.py", line 1000, in _agg_general
result = self._cython_agg_general(
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/groupby/groupby.py", line 1035, in _cython_agg_general
result, agg_names = self.grouper.aggregate(
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/groupby/ops.py", line 591, in aggregate
return self._cython_operation(
File "/home/user/miniconda3/envs/py_env/lib/python3.8/site-packages/pandas/core/groupby/ops.py", line 471, in _cython_operation
raise NotImplementedError(f"{values.dtype} dtype not supported")
NotImplementedError: Sparse[float64, nan] dtype not supported
最佳答案
这是 Pandas 中的一个错误,与最近对 cython 优化 groupbys 的重构有关:
https://github.com/pandas-dev/pandas/issues/38980
你有两个选择:
to_dense()
在 groupby 之前将稀疏矩阵转换为稠密矩阵关于python - Pandas SparseDtype 不适用于 GroupBy,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66389049/
data.groupby(by="DAY").agg({"CLOSING_DATE": min}) 当我尝试对数据框进行分组以获取稀疏列的最旧日期(CLOSING_DATE 大部分为空)时,为什么会出
我正在尝试将一个大型稀疏数据帧保存到一个 hdf5 文件中,但我收到了一个归因错误: one_hot = pd.get_dummies(my_DF, columns=['cat'], sparse=T
我是一名优秀的程序员,十分优秀!