gpt4 book ai didi

Python Pandas OneHotEncoder 类别

转载 作者:行者123 更新时间:2023-12-01 07:21:19 31 4
gpt4 key购买 nike

我正在阅读有关 Python 中的 One Hot Encoding 的内容,其中有一行我无法解释其含义。代码如下:

ohe=preprocessing.OneHotEncoder(dtype=np.int,sparse=True,handle_unknown="ignore")
data=ohe.fit_transform(df[["country"]])

问题是当我打印这样的类别值时:

print (ohe.categories_)

它打印 [array(['EEUU', 'France', 'Portugal', 'Italy'], dtype=object)]

但是当我这样做时:

print (ohe.categories_[0])

['EEUU', 'France', 'Portugal', 'Italy']

我无法找到 [0] 的作用,它似乎从数组转换为列表,但为什么不使用类似 tolist() 函数的东西?

我在网上搜索过,但没有找到有关此表达式的解释,有什么帮助吗?

谢谢

最佳答案

[array(['EEUU', 'France', 'Portugal', 'Italy'], dtype=object)]是一个包含一个对象的列表。该对象是一个 numpy 数组。当你这样做时ohe.categories_[0] ,您访问此列表的第一项 - 它恰好是列表中的唯一项目。

ohe.categories_返回一个列表,因为它返回不同的 numpy输入中每一列的数组。自 df[["country"]]只有一列,它返回一个只有一个对象的列表。

如果你这样做了df[["country", "second_column"]]例如,您会得到一个包含两个数组的列表,并说明每个数组的类别。

关于Python Pandas OneHotEncoder 类别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57683480/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com