- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想知道是否可以在 Pyhton 分类方法中定义特征重要性/权重?例如:
model = tree.DecisionTreeClassifier(feature_weight = ...)
我在RandomForest中看到有一个属性feature_importance,它根据分析显示了特征的重要性。但我是否可以提前定义特征重要性以进行分析?
非常感谢您提前提供的帮助!
最佳答案
随机森林分类器中的特征重要性确定使用随机森林特定的方法(反转该特征的所有二进制测试,并获得额外的分类误差)。
因此,特征重要性是一个与模型的预测能力相关的概念,而不是与训练阶段相关的概念。现在,如果您想让您的模型比其他功能更喜欢某些功能,您将必须找到一些取决于模型的技巧。
对于sklearn
的DecisionTreeClassifier
来说,这样的技巧似乎并不简单。如果您知道某些类别将更容易通过您想要支持的某些功能来预测,您可以自定义类别权重;但这看起来很脏。
在其他类型的模型中,例如使用内核的模型,您可以通过设置与特征直接相关的超参数来更轻松地做到这一点。
如果您试图限制过度拟合,我也建议您删除您知道不那么重要的功能。
关于Python分类定义特征重要性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54198470/
在 GGally::ggpair 的最新版本中,相关值用 * 显示,如下图所示。我想删除 *s 并保留相关值。 我看过 ggpairs 代码,但它对我来说并不明显。 GGally::ggpairs(d
在 GGally::ggpair 的最新版本中,相关值用 * 显示,如下图所示。我想删除 *s 并保留相关值。 我看过 ggpairs 代码,但它对我来说并不明显。 GGally::ggpairs(d
我正在尝试使用在 weka 库中实现的 SVM 分类来对一些数据进行分类。我的分类代码如下所示: BufferedReader reader = new BufferedReader(new File
我已经为 jdbm 构建了 Lucene Directory 实现,一个嵌入式Java数据库。 Directory API 的一部分是与"file"修改日期相关的两个方法:touchFile 和 fi
我的任务是编写一个函数,将文件中单词的长度与整数进行比较,然后返回所有符合该大小的单词。我得到的答案几乎相同,除了我没有像他们那样包含 string.strip() : def get_words(d
xgb.importance 命令返回由 f score 衡量的特征重要性图。 这个f分数代表什么,它是如何计算的? 输出: Graph of feature importance 最佳答案 这是一个
有一个二元分类问题:如何获得 Ranger 模型变量的 Shap 贡献? 示例数据: library(ranger) library(tidyverse) # Binary Dataset df %
如今 servlet 在哪里使用? 我知道 servlet 是在面向请求/响应的服务器(例如支持 Java 的 Web 服务器)中运行的模块。但是现在我没有听到任何人使用 servlet。这可能是因为
我是一名优秀的程序员,十分优秀!