gpt4 book ai didi

python - 在使用 scikit 学习进行特征选择后识别过滤后的特征

转载 作者:太空宇宙 更新时间:2023-11-04 05:49:20 24 4
gpt4 key购买 nike

这是我的 feature selection method 代码在 Python 中:

from sklearn.svm import LinearSVC
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target
X.shape
(150, 4)
X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y)
X_new.shape
(150, 3)

但是在获得新的 X(因变量 - X_new)之后,我如何知道在这个新的更新变量中删除了哪些变量以及考虑了哪些变量? (哪一个被删除或哪三个存在于数据中。)

获得此标识的原因是对新测试数据应用相同的过滤。

最佳答案

稍微修改了您的代码。对于每个类,可以通过查看 LinearSVC 的系数来了解所使用的特征。根据文档,coef_ : array, shape = [n_features] if n_classes == 2 else [n_classes, n_features]

对于新数据,只需对其应用转换即可。

from sklearn.svm import LinearSVC
from sklearn.datasets import load_iris
import numpy as np

iris = load_iris()
X, y = iris.data, iris.target
print X.shape

lsvc = LinearSVC(C=0.01, penalty="l1", dual=False)
X_new = lsvc.fit_transform(X, y)
print X_new.shape

print lsvc.coef_

newData = np.random.rand(100,4)
newData_X = lsvc.transform(newData)
print newData_X.shape

关于python - 在使用 scikit 学习进行特征选择后识别过滤后的特征,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30984231/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com