gpt4 book ai didi

python - 使用 groupby 对 pandas 中的分类变量删除未使用的类别

转载 作者:太空狗 更新时间:2023-10-30 00:38:12 25 4
gpt4 key购买 nike

根据 Categorical Data - Operations ,默认情况下 groupby 将显示“未使用”类别:

In [118]: cats = pd.Categorical(["a","b","b","b","c","c","c"], categories=["a","b","c","d"])

In [119]: df = pd.DataFrame({"cats":cats,"values":[1,2,2,2,3,4,5]})

In [120]: df.groupby("cats").mean()
Out[120]:
values
cats
a 1.0
b 2.0
c 4.0
d NaN

如何获得“未使用”类别被删除的结果?例如

  values
cats
a 1.0
b 2.0
c 4.0

最佳答案

从 0.23 版开始,您可以在 groupby 调用中指定 observed=True 以实现所需的行为。

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.groupby.html

关于python - 使用 groupby 对 pandas 中的分类变量删除未使用的类别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48064965/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com