gpt4 book ai didi

Scikit-Learn 线性回归如何获得系数各自的特征?

转载 作者:行者123 更新时间:2023-12-03 14:39:56 25 4
gpt4 key购买 nike

我试图通过评估我的回归系数输出来执行特征选择,并选择具有最高幅度系数的特征。问题是,我不知道如何获得相应的特征,因为只有系数从 coef._ 属性返回。文档说:

Estimated coefficients for the linear regression problem. If multiple targets are passed during the fit (y 2D), this is a 2D array of shape (n_targets, n_features), while if only one target is passed, this is a 1D array of length n_features.



我正在传入我的regression.fit(A,B),其中A 是一个二维数组,文档中的每个特征都有tfidf 值。示例格式:
         "feature1"   "feature2"
"Doc1" .44 .22
"Doc2" .11 .6
"Doc3" .22 .2

B 是我的数据目标值,它只是与每个文档相关联的数字 1-100:
"Doc1"    50
"Doc2" 11
"Doc3" 99

使用regression.coef_,我得到一个系数列表,但不是它们对应的特征!我怎样才能获得这些功能?我猜我需要修改我的 B 目标的结构,但我不知道如何。

最佳答案

我发现有效的是:

X = 你的自变量

coefficients = pd.concat([pd.DataFrame(X.columns),pd.DataFrame(np.transpose(logistic.coef_))], axis = 1)

您所说的假设:regression.coef_ 的顺序与 TRAIN 集中的顺序相同,这在我的经验中是成立的。 (使用基础数据并检查 X 和 y 之间的相关性)

关于Scikit-Learn 线性回归如何获得系数各自的特征?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26951880/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com