python - 逻辑回归的 MLE 对数似然给出除以零误差-6ren

python - 逻辑回归的 MLE 对数似然给出除以零误差

转载作者：行者123 更新时间：2023-11-30 09:08:23

26

4

我想计算逻辑回归模型的对数似然。

def sigma(x):
    return 1 / (1 + np.exp(-x))

def logll(y, X, w):
    """"
    Parameters
    y : ndarray of shape (N,)
        Binary labels (either 0 or 1).
    X : ndarray of shape (N,D)
        Design matrix.
    w : ndarray of shape (D,)
        Weight vector.
    """
    p = sigma(X @ w)
    y_1 = y @ np.log(p)
    y_0 = (1 - y) @ (1 - np.log(1 - p))
    return y_1 + y_0

logll(y, Xz, np.linspace(-5,5,D))

应用此函数会导致

/opt/conda/lib/python3.6/site-packages/ipykernel_launcher.py:16: 
RuntimeWarning: divide by zero encountered in log
  app.launch_new_instance()

我希望 y_0 是负 float 。如何避免此错误？代码中是否存在错误？

编辑 1

X @ w statistics:
Max: 550.775133944
Min: -141.972597608
Sigma(max): 1.0 => Throws error in y_0 in np.log(1 - 1.0)
Sigma(min): 2.19828642169e-62

编辑2

我还可以访问这个在对数空间中计算 sigma 的 Logsigma 函数:

def logsigma (x):
   return np.vectorize(np.log)(sigma(x))

不幸的是，我没有找到重写 y_0 的方法。以下是我的做法，但显然不正确。

def l(y, X, w):
    y_1 = np.dot(y, logsigma(X @ w))
    y_0 = (1 - y) @ (1 - np.log(1 - logsigma(X @ w)))
    return y_1 + y_0

最佳答案

首先，我认为您在对数似然公式中犯了一个错误:它应该是 y_0 和 y_1 的简单总和，而不是指数:

除以零可能是由 X @ w 中较大的负值(我的意思是绝对值较大)引起的，例如sigma(-800) 在我的机器上恰好是 0.0，因此它的日志会导致“RuntimeWarning:在日志中遇到除零” .

确保使用接近零的小值初始化网络，并且在多次反向传播迭代后不会出现梯度爆炸。

顺便说一句，这是我用于交叉熵损失的代码，它也适用于多类问题:

def softmax_loss(x, y):
  """
  - x: Input data, of shape (N, C) where x[i, j] is the score for the jth class
    for the ith input.
  - y: Vector of labels, of shape (N,) where y[i] is the label for x[i] and
    0 <= y[i] < C
  """
  probs = np.exp(x - np.max(x, axis=1, keepdims=True))
  probs /= np.sum(probs, axis=1, keepdims=True)
  N = x.shape[0]
  return -np.sum(np.log(probs[np.arange(N), y])) / N

UPD:当没有其他帮助时，还有一个数字技巧(在评论中讨论):计算 log(p+epsilon) 和 log(1-p+epsilon) 具有较小的正 epsilon 值。这可以确保 log(0.0) 永远不会发生。

关于python - 逻辑回归的 MLE 对数似然给出除以零误差，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46510929/

26

4

0

文章推荐： machine-learning - 在 Keras 中微调 InceptionV3

文章推荐： php - 一起使用 javascript 和 php

文章推荐： javascript - 添加输入的电话号码验证

python 对数
我想在 python 中找出一个整数的 log10，但我得到了一个错误，比如数学域错误我的代码是这样的w=math.log10(q*q1)/math.log10(2) 其中 q1,q2 是整数是的
NumPy舍入小数、对数、求和和乘积运算详解
舍入小数在 NumPy 中，主要有五种方法来舍入小数：截断去除小数部分，并返回最接近零的浮点数。使用 trunc() 和 fix() 函数。示例： import numpy as n
javascript - 对数 slider
我有一个数值范围为 0 到 100 的 slider 。我想将它们映射到 100 到 10,000,000 的范围内。我在网上看到过一些函数，但它们都是用 C++ 编写的。我需要它在 Javasc
ada - 如何获得整数的 10 对数？
我想请用户输入一个整数(N)，然后显示他/她输入的整数的 10 对数。我已经成功计算了 10 对数，但不知道如何像下面这样显示它: Write in an Integer: 455666 455666
Zedgraph，对数 x 轴的值再次重复
我将 x 轴设置为对数刻度。最大值为10000，最小值为1。 GraphPane mypane = zedgraphcontrol.GraphPane; mypane.XAxis.Type = Axi
python - 对数 Gamma 函数的快速算法
我正在尝试编写一个快速算法来计算 log gamma function 。目前我的实现看起来很幼稚，只是迭代了 1000 万次来计算 gamma 函数的对数(我还使用 numba 来优化代码)。 im
python - 对数 y 轴使刻度标签消失
这个问题在这里已经有了答案: How to show minor tick labels on log-scale with Matplotlib (2 个答案) 关闭 7 年前。将行 plt.y
math - 自定义轴刻度 - "Reverse"对数？
抱歉标题不好 ;) 我正在尝试重新创建我在其他一些工作中遇到的 matlab 图，但我不太了解他们使用的比例。 y轴增量如下(从上往下[+ve y]): 0.9999,0.999,0.99,0.9,0
ruby 精确数对数(对数)函数
由于 1000 的以 10 为底的对数是 3，您可能期望 Math::log(1000, 10) 返回 3。相反，它返回 2.9999999999999996。这是因为 Ruby 中的 float
javascript - Highcharts 对数 X 轴在没有零值或阈值低于零或最小值的情况下失败
我对对数 X 轴有疑问。阈值大于 0，x 的最小值为 1，并且所有 X 值都大于 0。并且仍然给我相同的错误 Can't plot zero or subzero values on a logari
android - MPAndroidChart 对数 Y 轴
我需要在我的应用程序中实现折线图，我想使用 MPAndroidChart。问题是 y 轴上的值将介于 1 和 1x10^-12 之间。这就是为什么我需要在该轴上的对数 View 。有没有办法用那个库
javascript - 对数 slider 返回 NaN
我正在尝试按照 Logarithmic slider 中的示例进行操作. 这是我使用的代码: Timeline._MIN_PER_MINUTE = 1; Timeline._MIN_PER_HOUR
Java 对数 log(num, base)(已关闭)
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 9 年前。 Improve th
python - 对数 y 轴的 matplotlib 条形图
我尝试为对数 y 轴绘制条形图。不幸的是，如果我将 y 轴设置为对数，则不再有条形图。我该怎么做才能实现这一目标？是否可以在 bar-function 中设置引用点(默认似乎为零)？我的代码是: i
algorithm - Big Oh 对数(ish)复杂度计算
所以我一直在努力掌握 Big Oh 的计算方法。我觉得我已经掌握了基础知识，但对看似非常简单的计算感到困惑。所以如果下面的计算有很大的 O(n log n)(我真的希望我至少做对了)改变循环的顺序对复
matlab - 如何绘制(半)对数 3d 图？ (Matlab)
我知道二维绘图的 semilogx 和 semilogy。 SURF 和 MESH 有什么等价物吗？最佳答案如上述链接所述，要将所有三个轴设置为对数刻度，请使用 set(gca, 'XScale'
ruby - 在 Ruby 中计算 Base-n 对数
这看起来很简单，但我在用 Ruby 计算 log (Base 5) 时遇到了问题。显然标准的 base-10 日志工作正常: >> value = Math::log(234504) => 12.3
c - 关于 C 代码和 Pollard 对数 rho 算法的问题
这段代码是用 C 语言根据 pollard 的对数 rho 算法(来自 wiki)编写的。在此代码中，如果我输入 alpha=2、beta=5、N=1019，则必须返回 a=681、b=378、A=3
matlab - 如何在 Matlab 上的(半)对数 3d 图上获得漂亮的色标？
有了this question之后通过指向 an external site 的链接回答，我意识到我解决了一个问题，只是为了得到另一个问题:在对数刻度上，MESH 和 SURF 函数的 C=Z 参数不
c++ - 如何找到满足 GCD(a,b) = x 的 a,b
我正在尝试解决 the SPOJ problem PGCD , 它询问最大公约数表中出现了多少个素数。我想到的第一个想法是先通过筛分生成素数。然后，对于每个素数 p，查看有多少对(a，b)，其中

首页

博学

6Ren·AI

商城

python - 逻辑回归的 MLE 对数似然给出除以零误差