gpt4 book ai didi

computer-vision - RetinaNet 中的焦点损失

转载 作者:行者123 更新时间:2023-12-04 00:28:20 26 4
gpt4 key购买 nike

谁能简单解释一下什么是 RetinaNet 中的焦点损失从下面的2张纸用于对象检测的特征金字塔网络密集物体检测的焦点损失

最佳答案

focal loss可以定义为(注:原论文描述了二分类的loss,但这里我将其扩展为多类情况):

enter image description here

其中K表示类数; yi 如果 ground-truth 属于第 i 个类,则为 1,否则为 0; pi 是第 i 类的预测概率; γ∈(0,+∞)为聚焦参数; αi∈[0,1] 是第 i 个类的加权参数。损失类似于分类交叉熵,如果 γ=0αi=1,它们将是等价的。那么,这两个附加参数的作用是什么?

正如原始论文指出的那样,类别不平衡是一个非常成问题的问题,它在实践中限制了检测器的性能。这是因为图像中的大多数位置都是容易否定的(这意味着它们可以很容易地被检测器分类为背景)并且没有提供有用的学习信号;更糟糕的是,由于它们占输入的很大一部分,它们可以压倒损失和计算梯度并导致退化模型。为了解决这个问题,focal loss 引入了聚焦参数 γ 来降低分配给易于分类示例的损失的权重。这种影响随着 γ 值的增加而增加,并使网络更加关注困难示例。

平衡参数α对于解决类不平衡也很有用。它可以通过逆类频率(或作为超参数)设置,以便可以降低分配给背景类示例的损失。

注意,由于这两个参数相互影响,所以应该一起选择。一般来说,随着γ的增加,α应该会稍微降低11。

这里有一篇文章更详细地解释了 RetinaNet:https://blog.zenggyu.com/en/post/2018-12-05/retinanet-explained-and-demystified/

关于computer-vision - RetinaNet 中的焦点损失,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54461726/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com