gpt4 book ai didi

python - 如何将混合(分类和数字)特征传递给sklearn中的决策树回归器?

转载 作者:行者123 更新时间:2023-11-30 09:17:59 29 4
gpt4 key购买 nike

如何将分类和数值特征传递给 sklearn 中的 DecisionTreeRegressor?

下面的代码展示了如何使用DecisionTreeRegressor来实现数字特征:

from sklearn import tree
make_tree = tree.DecisionTreeRegressor()
fit_tree = make_tree.fit(X_train, y_train)

最佳答案

首先,所有分类特征都应该进行编码(用数字表示),以便回归模型可以解释。为此,您可以使用LabelEncoder接下来是 OneHotEncoder 。以high-cardinal为例功能,您可以使用FeatureHasher .

举个例子:

from sklearn.feature_extraction import FeatureHasher

# n_feature: number of unique values in the feature(s)
# input_type should be passed as 'string' to be compatible to pandas DataFrames
feature_hasher = FeatureHasher(n_features=5000, input_type='string')
df['COLUMN_NAME'] = feature_hasher.transform(df['COLUMN_NAME'])

然后,您可以将特征传递给回归器。

关于python - 如何将混合(分类和数字)特征传递给sklearn中的决策树回归器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50191729/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com