gpt4 book ai didi

python - 为什么不应该使用sklearn LabelEncoder编码输入数据?

转载 作者:行者123 更新时间:2023-12-01 15:12:15 27 4
gpt4 key购买 nike

sklearn.LabelEncoder的docs

This transformer should be used to encode target values, i.e. y, and not the input X.



为什么是这样?

我仅发布了此建议的一个示例,尽管实际工作量似乎更多,但实际上却被忽略。
https://www.kaggle.com/matleonard/feature-generation包含
#(ks is the input data)

# Label encoding
cat_features = ['category', 'currency', 'country']
encoder = LabelEncoder()
encoded = ks[cat_features].apply(encoder.fit_transform)

最佳答案

更改输出值y没什么大不了的,因为它仅基于该值重新学习(如果它是基于错误的回归)。

如果它改变了输入值“X”的权重,将导致无法进行正确预测的问题。

如果没有太多选项(例如2类别,2种货币,2个城市编码为int-s),则可以在X上进行操作,不会对游戏产生太大影响。

关于python - 为什么不应该使用sklearn LabelEncoder编码输入数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59914210/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com