gpt4 book ai didi

python - 如何计算 GradientBoostingClassifier 的特征重要性

转载 作者:太空狗 更新时间:2023-10-30 02:08:18 24 4
gpt4 key购买 nike

我正在使用 scikit-learn 的梯度提升树分类器,GradientBoostingClassifier .它使特征重要性得分在 feature_importances_ 中可用。如何计算这些特征重要性?

我想了解 scikit-learn 使用的是什么算法,以帮助我了解如何解释这些数字。该算法未在文档中列出。

最佳答案

这已记录在案 elsewhere在 scikit-learn 文档中。具体来说,这是它的工作原理:

对于每棵树,我们将特征 F 的特征重要性计算为将遍历基于特征 F split 的节点的样本分数(参见 here)。然后,我们对所有树的这些数字进行平均(如 here 所述)。

没有准确描述 scikit-learn 如何估计将遍历在特征 F 上 split 的树节点的节点分数。

解释:分数将在 [0,1] 范围内。分数越高表示该特征越重要。这是一个形状为 (n_features,) 的数组,其值为正且总和为 1.0

关于python - 如何计算 GradientBoostingClassifier 的特征重要性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44163482/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com