gpt4 book ai didi

python - pandas get_dummies 如何记住哪个值成为哪个新类别?

转载 作者:行者123 更新时间:2023-11-30 08:49:11 25 4
gpt4 key购买 nike

使用 get_dummies 方法一次对多个分类变量进行单热编码似乎很容易,但是如何记住哪个是哪个,以便我的测试数据与训练数据具有相同的特征?例如:

我的训练数据集具有类别特征:

   X
cat
dog
lion
lion

在 get_dummies 之后,我得到了这样的东西:

   X_1   X_2   X_3
1 0 0
0 1 0
0 0 1
0 0 1

训练模型后,我准备测试我很棒的魔法模型,这里是测试数据:

   X
cat
cat
lion

如果我应用 pd.get_dummies 方法,我会得到这样的结果:

   X_1      X_2
1 0
1 0
0 1

这将与我的训练数据特征不一致,而且我根本无法将我的模型应用于测试数据。

有什么建议可以让我得到像下面这样的东西吗?

   X_1   X_2   X_3
1 0 0
1 0 0
0 0 1

如何获得拟合和转换功能?再说一遍,我有超过 50 个分类特征,我无法对它们一一应用 LabelEncoder,然后应用 One_Hot_Encoder。

有什么建议吗?谢谢。

最佳答案

我对所有数据使用 get_dummies,然后将其分为训练和测试。

关于python - pandas get_dummies 如何记住哪个值成为哪个新类别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46072777/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com