- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在运行 SciKit Learn 的决策树算法,我想获取 Feature_importance 向量以及特征名称,以便我可以确定哪些特征在标记过程中占主导地位。你可以帮帮我吗?谢谢。
最佳答案
假设您有样本作为 pandas.DataFrame
的行:
from pandas import DataFrame
features = DataFrame({'f1': (1, 2, 2, 2), 'f2': (1, 1, 1, 1), 'f3': (3, 3, 1, 1)})
labels = ('a', 'a', 'b', 'b')
然后使用树或森林分类器:
from sklearn.tree import DecisionTreeClassifier
classifier = DecisionTreeClassifier()
classifier.fit(features, labels)
然后重要性应该匹配框架列:
for name, importance in zip(features.columns, classifier.feature_importances_):
print(name, importance)
# f1 0.0
# f2 0.0
# f3 1.0
关于python - SciKit Learn 决策树中的 Feature_importance 向量以及特征名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40159161/
我正在使用 Python 的 sklearn 随机森林 (ensemble.RandomForestClassifier) 进行分类,并使用 feature_importances_ 为分类器寻找重要
在 scikit learn 中使用 DecisionTreeClassifier 时,可以轻松获得决策树和重要特征。但是,如果我和装袋功能(例如 BaggingClassifier),我将无法获得它
我有一个以时间序列作为数据输入的分类任务,其中每个属性 (n=23) 代表一个特定的时间点。除了绝对分类结果之外,我还想知道哪些属性/日期对结果的贡献有多大。因此,我只使用 feature_impor
我正在运行 SciKit Learn 的决策树算法,我想获取 Feature_importance 向量以及特征名称,以便我可以确定哪些特征在标记过程中占主导地位。你可以帮帮我吗?谢谢。 最佳答案 假
1.环境信息 操作系统:WindowsPython版本:Python 2.7.13 2.错误信息: ValueError:无法解码 JSON 对象 lgb_train = lgb.Dataset(X_
我正在使用 eli5 explain_weights scikit-learn 的随机森林分类器上的函数。我在eli5见过documentation (第 30-31 页)该函数能够返回每个类别的特征
我正在尝试在 KNeighborsClassifier 上应用 RFECV 来消除无关紧要的特征。为了使问题可重复,以下是虹膜数据的示例: from sklearn.datasets import l
我是一名优秀的程序员,十分优秀!