gpt4 book ai didi

image-processing - 为什么faster-rcnn端到端训练只做近似?

转载 作者:行者123 更新时间:2023-12-04 12:01:21 30 4
gpt4 key购买 nike

在更快的 rcnn ( https://arxiv.org/abs/1506.01497 ) 中,

有两种方法可以训练网络。

一种方法是联合训练 rpn 和 fast rcnn。

另一种方法是以端到端的方式训练 rpn 和 fast rcnn。

但是作者表示,在端到端的训练中,结果只是近似于联合训练。

仅近似的原因是

this solution ignores the derivative w.r.t. the proposal boxes’ coordinates that are also network responses, so is approximate.



但是,根据网络定义( https://github.com/rbgirshick/py-faster-rcnn/blob/master/models/pascal_voc/VGG16/faster_rcnn_end2end/train.prototxt ),rpn 的边界框回归在每次训练迭代时都会更新,因此不会被忽略。

那么,为什么它忽略了提案框坐标的导数?这意味着什么?

最佳答案

滑梯Training R-CNNs of various velocities在第 40-45 页详细讨论了这一点。简而言之,这是因为损失函数对 ROI 层的导数是未定义的,所以使用了代理梯度,在这种情况下,这个导数是未定义的。
附言
Link to ICCV 2015 Tutorial
The Github README page guide me to the slide

关于image-processing - 为什么faster-rcnn端到端训练只做近似?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47351768/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com