gpt4 book ai didi

python - 根据feature_importances_减少特征数量

转载 作者:太空宇宙 更新时间:2023-11-03 16:58:03 26 4
gpt4 key购买 nike

我已经构建了一个 scikit learn 随机森林分类器模型,并希望根据 feature_importances_ 减少特征数量

from sklearn.ensemble import RandomForestClassifier
model = RandomForestClassifier(5000)

model.fit(data[train], target[train])

model.feature_importances_

如何对模型进行子集化,使其仅包含通过 feature_importances_ 识别的特征(例如前 5 个特征)。

最佳答案

如果您使用的是 0.17,则可以使用 SelectFromModel

from sklearn import datasets
from sklearn.ensemble import RandomForestClassifier
from sklearn.feature_selection import SelectFromModel

iris = datasets.load_iris()
X, y = iris.data, iris.target
model = RandomForestClassifier(5000)

new_model = SelectFromModel(model, threshold=0.5)

来自this example ,有一些方法可以调整threshold参数。

关于python - 根据feature_importances_减少特征数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35255632/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com