gpt4 book ai didi

python - 检查 DataFrame 中的哪些列是分类的

转载 作者:IT老高 更新时间:2023-10-28 20:29:55 25 4
gpt4 key购买 nike

我是 Pandas 的新手...当我不手动指定时,我想要一种简单而通用的方法来查找我的 DataFrame 中哪些列是 categorical每个列类型,不像 this SO question . df 使用以下命令创建:

import pandas as pd
df = pd.read_csv("test.csv", header=None)

例如

           0         1         2         3        4
0 1.539240 0.423437 -0.687014 Chicago Safari
1 0.815336 0.913623 1.800160 Boston Safari
2 0.821214 -0.824839 0.483724 New York Safari

.

更新 (2018/02/04) 问题假设数字列不是分类的,@Zero 的 accepted answer solves this .

小心 - 正如@Sagarkar 的评论指出的那样,这并不总是正确的。 困难在于数据类型和分类/有序/名义类型是正交概念,因此它们之间的映射并不简单。 @杰夫的answer下面指定了实现手动映射的精确方式。

最佳答案

您可以使用 df._get_numeric_data() 获取数字列,然后找出分类列

In [66]: cols = df.columns

In [67]: num_cols = df._get_numeric_data().columns

In [68]: num_cols
Out[68]: Index([u'0', u'1', u'2'], dtype='object')

In [69]: list(set(cols) - set(num_cols))
Out[69]: ['3', '4']

关于python - 检查 DataFrame 中的哪些列是分类的,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29803093/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com