gpt4 book ai didi

python - scikit learn(sklearn) 中的 RFECV 功能如何排名?

转载 作者:行者123 更新时间:2023-11-30 09:52:28 25 4
gpt4 key购买 nike

我使用递归特征消除和交叉验证 (rfecv) 来找到我拥有的多个特征的最佳准确度得分 (m =154)。

rfecv = RFECV(estimator=logreg, step=1, cv=StratifiedKFold(2),
scoring='accuracy')
rfecv.fit(X, y)

排名 (rfecv.ranking_) 和相关分数 (rfecv.grid_scores_) 让我感到困惑。正如您从前 13 个功能(排名前 10 名)中看到的,它们的排名不是基于分数。我知道排名与交叉验证过程中排除该功能的方式和时间有关。那么分数和排名有什么关系呢?我希望排名最高的功能得分最高。

Features/Ranking/Scores
b 1 0.692642743
a 1 0.606166207
f 1 0.568833672
i 1 0.54935204
l 2 0.607564808
j 3 0.613495238
e 4 0.626374391
l 5 0.581064621
d 6 0.611407556
c 7 0.570921354
h 8 0.570921354
k 9 0.576863707
g 10 0.576863707

最佳答案

_grid_scores 不是第 i 个特征的分数,它是估计器在使用第 i 个特征子集进行训练时产生的分数。

要理解这意味着什么,请记住递归特征消除 (RFE) 的工作原理是训练模型、评估模型,然后删除步骤最不重要的特征,然后重复。

因此,_grid_score[-1] 将是在所有特征上训练的估计器的分数。 _grid_score[-2] 将是删除了 step 特征后估计器的分数。 _grid_score[-3] 将是删除了 2*step 功能后估计器的分数。

因此,网格分数并不反射(reflect)单个特征的评分。事实上,如果步长大于1,则网格分数将少于特征。

关于python - scikit learn(sklearn) 中的 RFECV 功能如何排名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42491428/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com