- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我使用 Scikit learn selectKbest
选择最佳特征,从 900 个特征中选择大约 500 个。如下,其中 d 是所有特征的数据框。
from sklearn.feature_selection import SelectKBest, chi2, f_classif
X_new = SelectKBest(chi2, k=491).fit_transform(d, label_vs)
当我现在打印X_new
时,它只给我数字,但我需要所选功能的名称以便稍后使用它们。
我尝试了诸如X_new.dtype.names
之类的东西,但我没有得到任何结果,我尝试将X_new
转换为数据框,但我得到的唯一列名称是
1, 2, 3, 4...
有没有办法知道所选功能的名称是什么?
最佳答案
以下是使用 get_support()
的方法:
chY = SelectKBest(chi2, k=491)
X_new = chY.fit_transform(d, label_vs)
column_names = [column[0] for column in zip(d.columns,chY.get_support()) if column[1]]
从@AI_Learning的答案中,您可以通过以下方式获取列名称:
column_names = d.columns[chY.get_support()]
关于python - 从 selectKbest 获取特征名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54560611/
我正在使用 scikit learn 来训练分类模型。我的训练数据中既有离散特征也有连续特征。我想使用最大互信息进行特征选择。如果我有向量 x和标签 y并且前三个特征值是离散的,我可以像这样得到 MM
我使用 Scikit learn selectKbest 选择最佳特征,从 900 个特征中选择大约 500 个。如下,其中 d 是所有特征的数据框。 from sklearn.feature_sel
我想将特征选择的结果可视化为按降序排列的条形图。(仅前 10 个特征)我如何使用 matplotlib 来做到这一点?您可以在下面看到代码。 filename_train = 'C:\Users\x.
我试图通过将特征选择方法应用于我的数据集来找到最有值(value)的特征。我现在使用 SelectKBest 函数。我可以生成分值并根据需要对它们进行排序,但我不明白这个分值是如何计算的。我知道理论上
我在 sklearn 中使用 SelectKBest() 类进行特征选择。 SelectKBest() 可以将可调用的评分函数作为输入。在这种情况下,我想使用 mutual_info_regressi
在上课时,我被困在我认为必须是小问题的地方。我想用 SelectKBest 找出最重要的特征是什么(我将 k 从 2,4,6,8 改变) 我加载数据 data_dict = pickle.load(o
给定以下数据: import pandas as pd from sklearn.feature_selection import SelectKBest from sklearn.feature_s
我正在使用 SelectKBest()在 Sklearn 的 Pipeline()类将特征数量从 30 个减少到 5 个最佳特征。当我拟合分类器时,我会得到与特征选择不同的测试结果。但是我在我的代码中
我需要从数据集中为回归任务选择一些特征。但是数值来自不同的范围。 from sklearn.datasets import load_boston from sklearn.feature_selec
我想使用 SelectKBest 选择前 K 个特征并运行 GaussianNB: selection = SelectKBest(mutual_info_classif, k=300) data_t
我的问题是我应该首先对整个数据集执行 selectkbest sklearn 函数进行特征选择,然后将数据集划分为训练集和测试集,还是应该执行 selectkbest训练和测试数据集分区后?在第二个中
我正在尝试获取我的数据集的所有特征的分数。 file_data = numpy.genfromtxt(input_file) y = file_data[:,-1] X = file_data[:,0
我是 scikit-learn 和 python 的初学者,我使用 feature_selection 包中的 SelectKBest 尝试了这段看起来非常简单的代码。 train = pd.
我从 sklearn 实现了 SelectKBest,我想获得 K 个最佳列的名称,而不仅仅是每个列的值。 我需要做什么? 我的代码: X_new = SelectKBest(chi2, k=2).f
我正在尝试自动特征工程和选择,为此,我使用了 sklearn 中提供的波士顿房价数据集。 . from sklearn.datasets import load_boston import panda
我尝试在我的 SelectKBest 变量上使用 .fit(),一旦我的程序命中 skb.fit(X, y),我就会不断收到错误。不知道为什么。 我收到错误:fit % (self.score_fun
我有一个数据集,我尝试使用 SelectKBest 和 Chi2 获取特征重要性,但 SelectKBest 给出了分数特征为nan。 数据文件和代码文件位于 this链接 # Path to the
我正在尝试在多标签场景中将特征选择作为 scikit-learn 管道的一部分。我的目的是对于给定的 k 选择最佳的 K 个特征。 这可能很简单,但我不明白如何在这种情况下获取选定的特征索引。 在常规
我试图让 SelectKBest 示例的一个稍微修改的版本工作,但不断收到 ValueError("Unknown label type: %s"% repr(ys)) 这是我的代码: # Impor
我想做监督学习。 到目前为止,我知道对所有特征进行监督学习。 不过,我也想对 K 个最佳特征进行实验。 我阅读了文档,发现在 Scikit 中学习有 SelectKBest 方法。 不幸的是,在找到这
我是一名优秀的程序员,十分优秀!