java - 将 Logistic 回归损失函数转换为 Softmax-6ren

java - 将 Logistic 回归损失函数转换为 Softmax

转载作者：行者123 更新时间：2023-12-01 09:54:04

26

4

我目前有一个程序，它采用特征向量和分类，并将其应用于已知的权重 vector ，以使用逻辑回归生成损失梯度。这是代码:

double[] grad = new double[featureSize];

        //dot product w*x
        double dot = 0;
        for (int j = 0; j < featureSize; j++) {
            dot += weights[j] * features[j];
        }

        //-yi exp(-yi w·xi) / (1+ exp(-yi w·xi))
        double gradMultiplier = (-type) * Math.exp((-type) * dot) / (1 + (Math.exp((-type) * dot)));

        //-yi xi exp(-yi w·xi) / (1+ exp(-yi w·xi))
        for (int j = 0; j < featureSize; j++) {
            grad[j] = features[j] * gradMultiplier;
        }

        return grad;

我想做的是使用 Softmax 回归实现类似的东西，但是我在网上找到的所有 Softmax 信息并不完全遵循与我所了解的 Logit 损失函数相同的词汇，所以我保留变得困惑。我如何实现与上面类似但使用 Softmax 的函数？

根据 Softmax 的维基百科页面，我的印象是我可能需要多个权重 vector ，每个可能的分类都有一个。我错了吗？

最佳答案

Softmax 回归是 Logistic 回归的推广。在 Logistic 回归中，标签是二元的，而在 Softmax 回归中，它们可以采用两个以上的值。 Logistic 回归是指二项 Logistic 回归，Softmax 回归是指多项 Logistic 回归。

有一个关于它的优秀页面 here 。在您的代码中，您似乎尝试实现梯度下降来计算权重，以最小化成本函数。所提供的链接涵盖了该主题。

Based on the wikipedia page for Softmax, I'm under the impression that I might need multiple weight vectors, one for every possible classification. Am I wrong?

你是对的。如果您有 n 个特征和 K 个类别，那么您的权重就是 n 个元素的 K 个 vector ，如上图所示上面的链接。

如果有帮助请告诉我。

关于java - 将 Logistic 回归损失函数转换为 Softmax，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/37380543/

26

4

0

文章推荐： apl - 如何在 APL 编译器之间进行选择？

文章推荐： java - 如何在小程序上绕角旋转矩形？

Python Pandas 回归
[在此处输入图像描述][1]我正在努力弄清楚回归是否是我需要走的路线，以便解决我当前使用 Python 的挑战。这是我的场景: 我有一个 195 行 x 25 列的 Pandas Dataframe
python - 如何在机器学习中训练连续输出(回归)
我想训练回归模型(不是分类)，其输出是连续数字。假设我有输入变量 X，其范围在 -70 到 70 之间。我有输出变量 Y，其范围在 -5 到 5 之间。X 有 39 个特征，Y 有 16 个特征，每
python - 回归:如何逼近多维函数？
我想使用神经网络逼近 sinc 函数。这是我的代码: import tensorflow as tf from keras.layers import Dense from keras.models
database - Postgres 回归
我对 postgres 表做了一些更改，我想将其恢复到以前的状态。没有数据库的备份。有办法吗？比如，postgres 会自动拍摄快照并将其存储在某个地方，还是原始数据会永远丢失？最佳答案默认情况下
带矩阵的 Python 回归
我有大约 100 个 7x7 因变量矩阵(所以有 49 个因变量)。我的自变量是时间。我正在做一个物理项目，我应该通过求解 ODE 得到一个矩阵函数(矩阵的每个元素都是时间的函数)。我使用了 nump
regression - 对二元结果变量使用 OLS 回归
我之前曾被告知——出于完全合理的原因——当结果变量为二元变量时(即是/否、真/假、赢/输等)，不应运行 OLS 回归。但是，我经常阅读经济学/其他社会科学方面的论文，其中研究人员对二元变量运行 OLS
python - 使用生命线和分类变量的 Cox 回归
您好，我正在使用生命线包进行 Cox 回归。我想检查非二元分类变量的影响。有内置的方法吗？或者我应该将每个类别因子转换为一个数字？或者，在生命线中使用 kmf fitter，是否可以对每个因素执行此操
r - 具有定量和定性解释变量之间相互作用的多元 Logistic 回归
作为后续 this question ，我拟合了具有定量和定性解释变量之间相互作用的多元 Logistic 回归。 MWE如下: Type |z|) (Intercept) -0.65518
R:在动物园矩阵对象上滚动应用 lm 回归
我想在单个动物园对象中的多对数据系列上使用 lm 执行滚动回归。虽然我能够通过以下代码对动物园对象中的一对数据系列执行滚动回归: FunLm seat time(seat) seat fm
r - 如何拟合 Skellam 回归？
是否有一种简单的方法可以在 R 中拟合多元回归，其中因变量根据 Skellam distribution 分布？ (两个泊松分布计数之间的差异)？比如: myskellam <- glm(A ~ B
python - XGBoost 回归 - 预测值超出训练范围
包含各种特征和回归目标(称为 qval)的数据集用于训练 XGBoost 回归器。该值 qval 介于 0 和 1 之间，应具有以下分布: 到目前为止，还不错。但是，当我使用 xgb.save_mod
r - 如何将字符串作为变量传递给 felm 回归
这有效: felm(y ~ x1 + x2 | fe1 + fe2 | 0 | , data = data) 我想要: fixedeffects = "fe1 + fe2" felm(y ~ x1
r - 如何将字符串作为变量传递给 felm 回归
这有效: felm(y ~ x1 + x2 | fe1 + fe2 | 0 | , data = data) 我想要: fixedeffects = "fe1 + fe2" felm(y ~ x1
r - R中的惩罚 Gamma 回归
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
r - R 中的循环 - 回归
我刚刚开始使用 R 进行统计分析，而且我还在学习。我在 R 中创建循环时遇到问题。我有以下案例，我想知道是否有人可以帮助我。对我来说，这似乎是不可能的，但对你们中的一些人来说，这只是小菜一碟。我有不同
python - 没有预测器的 Sklearn 回归
是否可以在 sklearn 中使用或不使用(即仅使用截距)预测器来运行回归(例如逻辑回归)？这似乎是一个相当标准的类型分析，也许这些信息已经在输出中可用。我发现的唯一相关的东西是sklearn.sv
machine-learning - 回归。优化偏态分布的中位数而不是均值
假设我对一些倾斜的数据分布执行 DNN 回归任务。现在我使用平均绝对误差作为损失函数。机器学习中的所有典型方法都是最小化平均损失，但对于倾斜来说这是不恰当的。从实际角度来看，最好尽量减少中值损失。我
machine-learning - 机器学习中的大量特征不好(回归)？
我正在对公寓特征进行线性回归分析，然后预测公寓的价格。目前，我已经收集了我所在城市 13000 套公寓的特征。我有 23-25 个特征，我不确定在公寓价格预测中拥有如此多的特征是否正常。我有以下功能
python - Catboost 回归。函数外推
我是 ML 新手，对 catboost 有疑问。所以，我想预测函数值(例如 cos | sin 等)。我回顾了一切，但我的预测始终是直线是否可能，如果可能，我该如何解决我的问题我很高兴收到任何评论
python - 概率 SVM、回归
我目前已经为二进制类实现了概率(至少我这么认为)。现在我想扩展这种回归方法，并尝试将其用于波士顿数据集。不幸的是，我的算法似乎被卡住了，我当前运行的代码如下所示: from sklearn impor

首页

博学

6Ren·AI

商城

java - 将 Logistic 回归损失函数转换为 Softmax