python - 使用随机森林的 AUC-base 特征重要性-6ren

python - 使用随机森林的 AUC-base 特征重要性

转载作者：太空狗更新时间：2023-10-29 22:29:56

25

4

我正在尝试使用随机森林和逻辑回归来预测二元变量。我有严重不平衡的类(class)(Y=1 的大约 1.5%)。

随机森林中的默认特征重要性技术基于分类准确度(错误率)——这已被证明是不平衡类别的糟糕衡量标准(参见 here 和 here)。

The two standard VIMs for feature selection with RF are the Gini VIM and the permutation VIM. Roughly speaking the Gini VIM of a predictor of interest is the sum over the forest of the decreases of Gini impurity generated by this predictor whenever it was selected for splitting, scaled by the number of trees.

我的问题是:这种方法是否在 scikit-learn 中实现(就像在 R 包 party 中一样)？或者可能是解决方法？

PS:这个问题有点与an other有关。 .

最佳答案

scoring只是一个用于测试样本的性能评估工具，它不会在每个 split 节点进入内部的DecisionTreeClassifier算法。对于树算法，您只能将 criterion(每个拆分节点处的一种内部损失函数)指定为 gini 或 information entropy。

scoring 可用于交叉验证上下文，其目标是调整一些超参数(如 max_depth)。在您的情况下，您可以使用 GridSearchCV 使用评分函数 roc_auc 调整您的一些超参数。

关于python - 使用随机森林的 AUC-base 特征重要性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31289011/

25

4

0

文章推荐： python - DBF - 编码 cp1250

文章推荐： c# - 为什么 Volatile.Read 会带 ref 参数？

文章推荐： c# - 项目类型不允许添加新的 "Web User Control"

从 ggpairs 中删除 *(重要性)
在 GGally::ggpair 的最新版本中，相关值用 * 显示，如下图所示。我想删除 *s 并保留相关值。我看过 ggpairs 代码，但它对我来说并不明显。 GGally::ggpairs(d
从 ggpairs 中删除 *(重要性)
在 GGally::ggpair 的最新版本中，相关值用 * 显示，如下图所示。我想删除 *s 并保留相关值。我看过 ggpairs 代码，但它对我来说并不明显。 GGally::ggpairs(d
machine-learning - 获取SVM分类中的属性权重/重要性
我正在尝试使用在 weka 库中实现的 SVM 分类来对一些数据进行分类。我的分类代码如下所示: BufferedReader reader = new BufferedReader(new File
java - Lucene 目录中文件修改日期方法的目的/重要性？
我已经为 jdbm 构建了 Lucene Directory 实现，一个嵌入式Java数据库。 Directory API 的一部分是与"file"修改日期相关的两个方法:touchFile 和 fi
python - String.strip() 重要性
我的任务是编写一个函数，将文件中单词的长度与整数进行比较，然后返回所有符合该大小的单词。我得到的答案几乎相同，除了我没有像他们那样包含 string.strip() : def get_words(d
python - XGBoost 包中的特征分数(/重要性)是如何计算的？
xgb.importance 命令返回由 f score 衡量的特征重要性图。这个f分数代表什么，它是如何计算的？输出: Graph of feature importance 最佳答案这是一个
r - R 中 Ranger 的 SHAP 重要性
有一个二元分类问题:如何获得 Ranger 模型变量的 Shap 贡献？示例数据: library(ranger) library(tidyverse) # Binary Dataset df %
java - 与其他 'server' 应用程序相比，servlet 的用途、重要性
如今 servlet 在哪里使用？我知道 servlet 是在面向请求/响应的服务器(例如支持 Java 的 Web 服务器)中运行的模块。但是现在我没有听到任何人使用 servlet。这可能是因为

首页

博学

6Ren·AI

商城

python - 使用随机森林的 AUC-base 特征重要性