gpt4 book ai didi

python - SciKit-Learn GradientBoostingClassifier 中的零重要性特征删除无需重新调整

转载 作者:行者123 更新时间:2023-11-30 09:17:27 24 4
gpt4 key购买 nike

在 SciKit-Learn 中拟合 GradientBoostingClassifier 后,某些特征的重要性为零。

我的理解是,重要性为零意味着不会对此功能进行拆分。

如果我尝试使用不包含该功能的数据集进行预测,则会因不具备所有功能而引发错误。

当然,我意识到我可以删除零重要性特征,但我宁愿不改变已经适合的模型。 (如果我删除零重要性特征并重新安装,我会得到一个略有不同的模型。)

这是模型需要零重要性特征才能进行预测的错误,还是我没有考虑到零重要性特征?有没有办法获得完全相同的模型?

(我预见到一个关于为什么这很重要的问题 - 这是因为需要零重要性特征意味着从非常大的数据库中提取更多列,并且在模型中包含一个不执行任何操作的特征看起来很草率。)

最佳答案

这不是错误,而是预期行为。在模型经过训练后,Scikit 不会做出关于应该包含或不包含哪些功能的假设。

相反,当您为模型调用 fit 时,会隐式假设您已经执行了特征选择以删除对模型不重要的特征。一旦拟合,无论特征是否重要,您都将提供与用于拟合模型相同大小的数据集。

关于python - SciKit-Learn GradientBoostingClassifier 中的零重要性特征删除无需重新调整,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51619180/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com