Python分类定义特征重要性-6ren

Python分类定义特征重要性

转载作者：行者123 更新时间：2023-11-30 09:44:32

25

4

我想知道是否可以在 Pyhton 分类方法中定义特征重要性/权重？例如:

model = tree.DecisionTreeClassifier(feature_weight = ...)

我在RandomForest中看到有一个属性feature_importance，它根据分析显示了特征的重要性。但我是否可以提前定义特征重要性以进行分析？

非常感谢您提前提供的帮助!

最佳答案

随机森林分类器中的特征重要性确定使用随机森林特定的方法(反转该特征的所有二进制测试，并获得额外的分类误差)。

因此，特征重要性是一个与模型的预测能力相关的概念，而不是与训练阶段相关的概念。现在，如果您想让您的模型比其他功能更喜欢某些功能，您将必须找到一些取决于模型的技巧。

对于sklearn的DecisionTreeClassifier来说，这样的技巧似乎并不简单。如果您知道某些类别将更容易通过您想要支持的某些功能来预测，您可以自定义类别权重；但这看起来很脏。

在其他类型的模型中，例如使用内核的模型，您可以通过设置与特征直接相关的超参数来更轻松地做到这一点。

如果您试图限制过度拟合，我也建议您删除您知道不那么重要的功能。

关于Python分类定义特征重要性，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54198470/

25

4

0

文章推荐： java - 使用 apache poi 在 excel 文件中设置页面 View 模式

文章推荐： javascript - JS传递一个对象属性作为函数的参数

文章推荐： java - 在 Java 中使用 .actionPerformed 实现变量

文章推荐： java类路径找不到符号

从 ggpairs 中删除 *(重要性)
在 GGally::ggpair 的最新版本中，相关值用 * 显示，如下图所示。我想删除 *s 并保留相关值。我看过 ggpairs 代码，但它对我来说并不明显。 GGally::ggpairs(d
从 ggpairs 中删除 *(重要性)
在 GGally::ggpair 的最新版本中，相关值用 * 显示，如下图所示。我想删除 *s 并保留相关值。我看过 ggpairs 代码，但它对我来说并不明显。 GGally::ggpairs(d
machine-learning - 获取SVM分类中的属性权重/重要性
我正在尝试使用在 weka 库中实现的 SVM 分类来对一些数据进行分类。我的分类代码如下所示: BufferedReader reader = new BufferedReader(new File
java - Lucene 目录中文件修改日期方法的目的/重要性？
我已经为 jdbm 构建了 Lucene Directory 实现，一个嵌入式Java数据库。 Directory API 的一部分是与"file"修改日期相关的两个方法:touchFile 和 fi
python - String.strip() 重要性
我的任务是编写一个函数，将文件中单词的长度与整数进行比较，然后返回所有符合该大小的单词。我得到的答案几乎相同，除了我没有像他们那样包含 string.strip() : def get_words(d
python - XGBoost 包中的特征分数(/重要性)是如何计算的？
xgb.importance 命令返回由 f score 衡量的特征重要性图。这个f分数代表什么，它是如何计算的？输出: Graph of feature importance 最佳答案这是一个
r - R 中 Ranger 的 SHAP 重要性
有一个二元分类问题:如何获得 Ranger 模型变量的 Shap 贡献？示例数据: library(ranger) library(tidyverse) # Binary Dataset df %
java - 与其他 'server' 应用程序相比，servlet 的用途、重要性
如今 servlet 在哪里使用？我知道 servlet 是在面向请求/响应的服务器(例如支持 Java 的 Web 服务器)中运行的模块。但是现在我没有听到任何人使用 servlet。这可能是因为

首页

博学

6Ren·AI

商城

Python分类定义特征重要性