gpt4 book ai didi

python - 计算数据框中分类特征的级别

转载 作者:行者123 更新时间:2023-12-01 01:41:43 25 4
gpt4 key购买 nike

我正在尝试计算数据框中每个分类特征的级别。这是一个例子:

df_cat = pd.DataFrame([['green','M',10.1,'class1'],['red','L',13.5,'class2'],['blue','XL',15.3,'class1'],['red', 'M', 9, 'class1']], columns=['A','B','C','D'])

所需的输出:
一个3
B 3
D 2

最佳答案

使用select_dtypes过滤列并调用DataFrame.nunique:

df.select_dtypes([object]).nunique()

A 3
B 3
D 2
dtype: int64

如果它们是分类列而不是对象,则首选此更严格的过滤步骤:

# Categorical column conversion.
df = df.astype(dict.fromkeys('AB', 'category'))

df.dtypes
A category
B category
C float64
D object
dtype: object

df.select_dtypes([pd.Categorical]).nunique()
A 3
B 3
dtype: int64

关于python - 计算数据框中分类特征的级别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51813208/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com