- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在尝试使用Logistic回归创建二进制分类。目前,我正在确定功能的重要性。我已经进行了数据预处理(一次热编码和采样),并使用XGBoost和RandomFOrestClassifier运行了它,没问题
但是,当我尝试拟合LogisticRegression模型(下面是我在Notebook中的代码)时,
from sklearn.linear_model import LogisticRegression
#Logistic Regression
# fit the model
model = LogisticRegression()
# fit the model
model.fit(np.array(X_over), np.array(y_over))
# get importance
importance = model.coef_[0]
# summarize feature importance
df_imp = pd.DataFrame({'feature':list(X_over.columns), 'importance':importance})
display(df_imp.sort_values('importance', ascending=False).head(20))
# plot feature importance
plt.bar(list(X_over.columns), importance)
plt.show()
它给出了一个错误
...
~\AppData\Local\Continuum\anaconda3\lib\site-packages\joblib\parallel.py in <listcomp>(.0)
223 with parallel_backend(self._backend, n_jobs=self._n_jobs):
224 return [func(*args, **kwargs)
--> 225 for func, args, kwargs in self.items]
226
227 def __len__(self):
~\AppData\Local\Continuum\anaconda3\lib\site-packages\sklearn\linear_model\_logistic.py in _logistic_regression_path(X, y, pos_class, Cs, fit_intercept, max_iter, tol, verbose, solver, coef, class_weight, dual, penalty, intercept_scaling, multi_class, random_state, check_input, max_squared_sum, sample_weight, l1_ratio)
762 n_iter_i = _check_optimize_result(
763 solver, opt_res, max_iter,
--> 764 extra_warning_msg=_LOGISTIC_SOLVER_CONVERGENCE_MSG)
765 w0, loss = opt_res.x, opt_res.fun
766 elif solver == 'newton-cg':
~\AppData\Local\Continuum\anaconda3\lib\site-packages\sklearn\utils\optimize.py in _check_optimize_result(solver, result, max_iter, extra_warning_msg)
241 " https://scikit-learn.org/stable/modules/"
242 "preprocessing.html"
--> 243 ).format(solver, result.status, result.message.decode("latin1"))
244 if extra_warning_msg is not None:
245 warning_msg += "\n" + extra_warning_msg
AttributeError: 'str' object has no attribute 'decode'
我用谷歌搜索,几乎所有的回答都说这个错误是因为scikit-learn库试图对已经解码的字符串进行解码。但是我不知道如何解决我的情况。我确保所有数据都是整数或float64,并且没有字符串。
最佳答案
我仍然尝试使用以下命令升级scikit-learn
,但仍无法解决AttributeError: 'str' object has no attribute 'decode'
问题
pip install scikit-learn -U
最后,下面的代码片段解决了该问题,将求解器添加为
liblinear
model = LogisticRegression(solver='liblinear')
关于python - AttributeError : 'str' object has no attribute 'decode' in fitting Logistic Regression Model,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65682019/
在 Azure 机器学习工作室的测试项目中,根据我的理解,我有一些问题。在我的项目(在 R 中)中,我使用了二元 Logistic 回归,但在 AML 中我发现了两个 Logistic 回归:二类和多
我想估计医疗数据逻辑回归中使用的 sigmoidal/logistic 的最佳参数(在最后提到:斜率和截距)。这是我用 python 所做的: import numpy as np from skle
我在 R 中运行逻辑回归模型。我使用了 Zelig 和 Car 包。但是,我想知道是否有一种简单的方法可以获得模型的模型拟合统计数据。 (伪 R 方、卡方、对数似然等) 最佳答案 假设 glm1 is
在逻辑回归中,SAS 可以选择使用“降序”选项对 1 而不是 0 进行建模。 R 中有什么方法可以让我们做同样的事情吗? 我正在使用的代码如下: glm(y~x1+x2+x3, family=bino
作为后续 this question ,我拟合了具有定量和定性解释变量之间相互作用的多元 Logistic 回归。 MWE如下: Type |z|) (Intercept) -0.65518
我已经开始使用 Vowpal Wabbit 对于逻辑回归,但是我无法重现它给出的结果。也许它确实有一些未记录的“魔法”,但是有没有人能够复制/验证/检查逻辑回归的计算? 例如,使用下面的简单数据,我们
有没有办法像 statsmodels 一样为 scikit 逻辑回归模型提供类似的、不错的输出?有了所有的 p 值,标准。一张表中的错误等? 最佳答案 正如您和其他人所指出的,这是 scikit le
我正在使用 vowpal wabbit 进行逻辑回归。我了解到,vowpal wabbit 从给定的训练数据中选择一个保留集进行验证。这组是随机选择的吗?我有一个非常不平衡的数据集,包含 100 多个
我使用逻辑回归编写了一个多类分类器,该分类器使用一对多方法进行训练。我想绘制经过训练的分类器的学习曲线。 学习曲线应该按类别绘制,还是应该作为整个分类器的单个图?这有什么不同吗? 需要澄清的是,学习曲
在scipy.special.expit中,逻辑函数实现如下: if x < 0 a = exp(x) a / (1 + a) else 1 / (1 + exp(-x)) 但
逻辑斯蒂映射在混沌数学中是一个很经典的例子,它可以说明混沌可以从很简单的非线性方程中产生。 逻辑斯蒂映射公式如下: x_n表示当前人口与最大人口数量的比值,mu为参数,相当于人口增长速率。
我是数据科学或机器学习的新手。我尝试从 here 实现代码,但预测只返回 1 个类。 这是我的代码: classification_data = data.drop([10], axis=1).val
请帮助解释 Weka 库中由 weka.classifiers.functions.Logistic 生成的逻辑回归结果。 我使用来自 Weka 示例的数字数据: @relation weather
RSNNS 上的 CRAN 文档仅提及 Act_Logistic 作为隐藏层激活函数的示例。 RSNNS 中是否有所有可用激活函数的列表? 我专门寻找双曲正切函数的语法。 最佳答案 是的,大多数(全部
我正在使用 scikit-learn 的 linear_model.LogisticRegression 来执行多项逻辑回归。我想初始化求解器的种子值,即我想给求解器它的初始猜测作为系数的值。 有谁知
glmnet 中有没有办法进行一阶交互? 例如,如果我的 X 矩阵是: V1 V2 V3 0 1 0 1 0 1 1 0 0 ... 有没有办法指定它在不手动创建列的情况下按照 `y
我目前有一个程序,它采用特征向量和分类,并将其应用于已知的权重 vector ,以使用逻辑回归生成损失梯度。这是代码: double[] grad = new double[featureSize];
我正在关注 Siraj Raval 关于使用梯度下降的逻辑回归的视频: 1) 较长视频的链接: https://www.youtube.com/watch?v=XdM6ER7zTLk&t=2686s
我目前正在学习机器学习,但没有统计学背景。无论我在哪里看到物流功能,它总是: wx + b 但是this example in Theano documentation使用: wx - b 请问是哪一
我正在编写一些基本的神经网络方法 - 特别是激活函数 - 并且已经达到了我垃圾数学知识的极限。我理解各自的范围(-1/1)(0/1)等,但不同的描述和实现让我感到困惑。 具体来说,sigmoid、lo
我是一名优秀的程序员,十分优秀!