gpt4 book ai didi

python - LabelEncoder().fit_transform 与用于分类编码的 pd.get_dummies

转载 作者:太空狗 更新时间:2023-10-30 02:41:21 25 4
gpt4 key购买 nike

最近我注意到,如果你有一个像这样的数据框df:

   A      B   C
0 0 Boat 45
1 1 NaN 12
2 2 Cat 6
3 3 Moose 21
4 4 Boat 43

您可以使用 pd.get_dummies 自动编码分类数据:

df1 = pd.get_dummies(df)

产生这个:

   A   C  B_Boat  B_Cat  B_Moose
0 0 45 1.0 0.0 0.0
1 1 12 0.0 0.0 0.0
2 2 6 0.0 1.0 0.0
3 3 21 0.0 0.0 1.0
4 4 43 1.0 0.0 0.0

在将其放入 pd.get_dummies 之前,我通常使用 LabelEncoder().fit_transform 来执行此类任务,但是如果我可以跳过几个步骤可取的。

我是否仅仅通过在我的整个数据帧上使用 pd.get_dummies 对其进行编码而丢失任何东西?

最佳答案

是的,如果您只想对字符串特征进行编码,则可以跳过 LabelEncoder 的使用。另一方面,如果您有一个整数分类列(而不是字符串),那么 pd.get_dummies 将保持原样(例如,请参阅您的 A 或 C 列)。在这种情况下,您应该使用 OneHotEncoder .理想情况下 OneHotEncoder 将支持整数和字符串,但这是 worked on at the moment .

关于python - LabelEncoder().fit_transform 与用于分类编码的 pd.get_dummies,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39645125/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com