gpt4 book ai didi

machine-learning - YOLOv3的损失函数是什么

转载 作者:行者123 更新时间:2023-11-30 08:37:03 25 4
gpt4 key购买 nike

我打算编写自己的 YOLOv3 实现,并提出损失函数的一些问题。原始论文提到他在类别预测部分使用了二元交叉熵,这就是我所做的。

我尝试通过原始暗网代码阅读一些代码,但没有找到任何与 BCE 丢失相关的内容。我还进一步阅读了一些使用 Keras、Pytorch 和 TensorFlow 的方法。每个人似乎对损失函数都有自己的看法。有的只用MSE估计宽度和高度,有的用BCE,有的用x,y,w,h用MSE,有的用BCE。

这是我的一些代码:

loss_x = self.mse_loss(x[mask], tx[mask])
loss_y = self.mse_loss(y[mask], ty[mask])
loss_w = self.mse_loss(w[mask], tw[mask])
loss_h = self.mse_loss(h[mask], th[mask])
loss_conf = self.bce_loss(pred_conf[conf_mask_false], tconf[conf_mask_false]) + self.bce_loss(pred_conf[conf_mask_true],tconf[conf_mask_true])
loss_cls = (1 / nB) * self.ce_loss(pred_cls[mask],torch.argmax(tcls[mask], 1))
loss = loss_x + loss_y + loss_w + loss_h + loss_conf + loss_cls

损失函数在训练中起着重要作用。我希望有人能帮我解决这个问题。

最佳答案

Yolo v3的损失函数,看src/yolo_layer.c

第 93 行框的增量

float delta_yolo_box(box truth, float *x, float *biases, int n, int index, int i, int j, int lw, int lh, int w, int h, float *delta, float scale, int stride)
{
box pred = get_yolo_box(x, biases, n, index, i, j, lw, lh, w, h, stride);
float iou = box_iou(pred, truth);

float tx = (truth.x*lw - i);
float ty = (truth.y*lh - j);
float tw = log(truth.w*w / biases[2*n]);
float th = log(truth.h*h / biases[2*n + 1]);

delta[index + 0*stride] = scale * (tx - x[index + 0*stride]);
delta[index + 1*stride] = scale * (ty - x[index + 1*stride]);
delta[index + 2*stride] = scale * (tw - x[index + 2*stride]);
delta[index + 3*stride] = scale * (th - x[index + 3*stride]);
return iou;
}

类的增量,第 111 行

void delta_yolo_class(float *output, float *delta, int index, int class, int classes, int stride, float *avg_cat)
{
int n;
if (delta[index]){
delta[index + stride*class] = 1 - output[index + stride*class];
if(avg_cat) *avg_cat += output[index + stride*class];
return;
}
for(n = 0; n < classes; ++n){
delta[index + stride*n] = ((n == class)?1 : 0) - output[index + stride*n];
if(n == class && avg_cat) *avg_cat += output[index + stride*n];
}
}

对象性的增量,第 178 行

l.delta[obj_index] = 0 - l.output[obj_index];
if (best_iou > l.ignore_thresh) {
l.delta[obj_index] = 0;

l.delta[obj_index] = 1 - l.output[obj_index];

损失=平方和

*(l.cost) = pow(mag_array(l.delta, l.outputs * l.batch), 2);

无论如何,我只是让您了解一下 Yolo V3 中的损失函数。有关详细说明,您应该关注此 github 讨论:
https://github.com/AlexeyAB/darknet/issues/1695#issuecomment-426016524

https://github.com/AlexeyAB/darknet/issues/1845#issuecomment-434079752

关于machine-learning - YOLOv3的损失函数是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55395205/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com