gpt4 book ai didi

python - sklearn 随机森林可以直接处理分类特征吗?

转载 作者:IT老高 更新时间:2023-10-28 20:38:18 27 4
gpt4 key购买 nike

假设我有一个分类特征,颜色,它采用值

['红色','蓝色','绿色','橙色'],

我想用它来预测随机森林中的某些东西。如果我对其进行一次热编码(即我将其更改为四个虚拟变量),我如何告诉 sklearn 这四个虚拟变量实际上是一个变量?具体来说,当 sklearn 随机选择要在不同节点上使用的特征时,它应该包括红色、蓝色、绿色和橙色的假人,或者不应该包括任何一个。

我听说没有办法做到这一点,但我想必须有一种方法来处理分类变量,而不是将它们任意编码为数字或类似的东西。

最佳答案

不,没有。某人的working on this并且补丁可能有一天会合并到主线中,但是目前除了虚拟(one-hot)编码之外,scikit-learn 中不支持分类变量。

关于python - sklearn 随机森林可以直接处理分类特征吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24715230/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com