machine-learning - Logistic回归预测概率-6ren

machine-learning - Logistic回归预测概率

转载作者：行者123 更新时间：2023-11-30 09:50:12

25

4

我目前正在使用 scikit-learn 的 LogisticRegression 来解决多类分类问题。我决定使用 LogisticRegression，因为我读了几篇文章，将其描述为一种在返回的预测概率方面经过良好校准的算法。

对于分类器的每个结果，我检查其预测概率以及分类观察与训练集中具有相同决策类的其余示例之间的距离。

令我惊讶的是，对于某些结果，即使预测某个类别的置信度超过 90%，余弦相似性度量也表明给定的示例平均与同一类别的一组示例几乎正交在训练集中。

有人可以提供一些线索来解释为什么会观察到这种差异吗？

我预计，对于与同一类的其余观察结果相差很大的示例，LogisticRegression 算法将返回较低的预测概率。

最佳答案

逻辑回归/分类将提供关于决策边界的结果，但不能保证边界同一侧的点(即属于同一类)将具有较小的余弦距离(甚至较小的欧几里得距离) )。

考虑 x-y 平面上的点，其中 y=0 以下的所有点都属于一个类，而上面的所有点都属于另一类。点(-1000, 1)和(1000, 1)属于同一类，但它们之间的余弦距离相对较大。另一方面，点 (1000, 1) 和 (1000, -1) 属于不同的类，但余弦距离非常小。

关于machine-learning - Logistic回归预测概率，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46594092/

25

4

0

文章推荐： python - python 线性回归中字符串的预测

文章推荐： java - 在 drl 文件中定义集合

文章推荐： python - Open AI Gym Cartpole 的策略梯度方法

azure - 二分类 Logistic VS 二元 Logistic 回归
在 Azure 机器学习工作室的测试项目中，根据我的理解，我有一些问题。在我的项目(在 R 中)中，我使用了二元 Logistic 回归，但在 AML 中我发现了两个 Logistic 回归:二类和多
python - 如何在 Logistic 回归中查找 Logistic/Sigmoidal 函数参数
我想估计医疗数据逻辑回归中使用的 sigmoidal/logistic 的最佳参数(在最后提到:斜率和截距)。这是我用 python 所做的: import numpy as np from skle
r - Logistic 回归的模型拟合统计量
我在 R 中运行逻辑回归模型。我使用了 Zelig 和 Car 包。但是，我想知道是否有一种简单的方法可以获得模型的模型拟合统计数据。 (伪 R 方、卡方、对数似然等) 最佳答案假设 glm1 is
r - Logistic 回归中的排序
在逻辑回归中，SAS 可以选择使用“降序”选项对 1 而不是 0 进行建模。 R 中有什么方法可以让我们做同样的事情吗？我正在使用的代码如下: glm(y~x1+x2+x3, family=bino
r - 具有定量和定性解释变量之间相互作用的多元 Logistic 回归
作为后续 this question ，我拟合了具有定量和定性解释变量之间相互作用的多元 Logistic 回归。 MWE如下: Type |z|) (Intercept) -0.65518
logistic-regression - Vowpal Wabbit逻辑回归的正确性？
我已经开始使用 Vowpal Wabbit 对于逻辑回归，但是我无法重现它给出的结果。也许它确实有一些未记录的“魔法”，但是有没有人能够复制/验证/检查逻辑回归的计算？例如，使用下面的简单数据，我们
python - Scikit Logistic 回归汇总输出？
有没有办法像 statsmodels 一样为 scikit 逻辑回归模型提供类似的、不错的输出？有了所有的 p 值，标准。一张表中的错误等？最佳答案正如您和其他人所指出的，这是 scikit le
logistic-regression - 在Vowpal wabbit中如何选择保留集
我正在使用 vowpal wabbit 进行逻辑回归。我了解到，vowpal wabbit 从给定的训练数据中选择一个保留集进行验证。这组是随机选择的吗？我有一个非常不平衡的数据集，包含 100 多个
optimization - 多类 Logistic 回归的学习曲线
我使用逻辑回归编写了一个多类分类器，该分类器使用一对多方法进行训练。我想绘制经过训练的分类器的学习曲线。学习曲线应该按类别绘制，还是应该作为整个分类器的单个图？这有什么不同吗？需要澄清的是，学习曲
python - logistic/sigmoid 函数实现数值精度
在scipy.special.expit中，逻辑函数实现如下: if x < 0 a = exp(x) a / (1 + a) else 1 / (1 + exp(-x)) 但
使用python画出逻辑斯蒂映射(logistic map)中的分叉图案例
逻辑斯蒂映射在混沌数学中是一个很经典的例子，它可以说明混沌可以从很简单的非线性方程中产生。逻辑斯蒂映射公式如下： x_n表示当前人口与最大人口数量的比值，mu为参数，相当于人口增长速率。
python - Logistic 回归仅预测 1 个类别
我是数据科学或机器学习的新手。我尝试从 here 实现代码，但预测只返回 1 个类。这是我的代码: classification_data = data.drop([10], axis=1).val
weka - 如何解释 Weka Logistic 回归输出？
请帮助解释 Weka 库中由 weka.classifiers.functions.Logistic 生成的逻辑回归结果。我使用来自 Weka 示例的数字数据: @relation weather
r - 除了 Logistic，RSNNS 包中还有哪些激活函数？
RSNNS 上的 CRAN 文档仅提及 Act_Logistic 作为隐藏层激活函数的示例。 RSNNS 中是否有所有可用激活函数的列表？我专门寻找双曲正切函数的语法。最佳答案是的，大多数(全部
python - 在 Python Logistic 回归中为求解器提供种子值
我正在使用 scikit-learn 的 linear_model.LogisticRegression 来执行多项逻辑回归。我想初始化求解器的种子值，即我想给求解器它的初始猜测作为系数的值。有谁知
r - 如何为 Lasso Logistic 回归生成所有一阶交互项？
glmnet 中有没有办法进行一阶交互？例如，如果我的 X 矩阵是: V1 V2 V3 0 1 0 1 0 1 1 0 0 ... 有没有办法指定它在不手动创建列的情况下按照 `y
java - 将 Logistic 回归损失函数转换为 Softmax
我目前有一个程序，它采用特征向量和分类，并将其应用于已知的权重 vector ，以使用逻辑回归生成损失梯度。这是代码: double[] grad = new double[featureSize];
machine-learning - 使用梯度下降理解 Logistic 回归的代码
我正在关注 Siraj Raval 关于使用梯度下降的逻辑回归的视频: 1) 较长视频的链接: https://www.youtube.com/watch?v=XdM6ER7zTLk&t=2686s
machine-learning - Logistic 函数加法或减法
我目前正在学习机器学习，但没有统计学背景。无论我在哪里看到物流功能，它总是: wx + b 但是this example in Theano documentation使用: wx - b 请问是哪一
function - 神经激活函数 - Logistic/Tanh/等之间的差异
我正在编写一些基本的神经网络方法 - 特别是激活函数 - 并且已经达到了我垃圾数学知识的极限。我理解各自的范围(-1/1)(0/1)等，但不同的描述和实现让我感到困惑。具体来说，sigmoid、lo

首页

博学

6Ren·AI

商城

machine-learning - Logistic回归预测概率