neural-network - lr_mult = 0 有什么影响？-6ren

neural-network - lr_mult = 0 有什么影响？

转载作者：行者123 更新时间：2023-12-02 01:01:23

我正在查看一些 Caffe 网络构建代码(在 BerkeleyVision pascalcontext-fcn8s net.py 文件中)，我找到了这一行:

L.Deconvolution(n.score_fr,
    convolution_param=dict(num_output=60, kernel_size=4, stride=2,
        bias_term=False),
    param=[dict(lr_mult=0)])

我想知道 lr_mult = 0 项的作用。在查看文档后我的第一个猜测是它应该阻止对内核权重的任何更新，但这看起来很奇怪，因为我假设默认初始化是随机的。这是做什么的？是否有其他代码或参数文件在某处初始化内核？

最佳答案

你是对的。设置 lr_mult=0 卡住层的权重。权重将保持固定，并且在整个训练过程中不会改变其初始值。
如果您按照代码进行操作，您会看到对 surgery.interp 的调用, 此函数在训练开始之前设置放大层的初始权重。由于 lr_mult=0，权重保持固定为这些值。

关于neural-network - lr_mult = 0 有什么影响？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50355013/

neural-network - lr_mult = 0 有什么影响？
我正在查看一些 Caffe 网络构建代码(在 BerkeleyVision pascalcontext-fcn8s net.py 文件中)，我找到了这一行: L.Deconvolution(n.sco
performance - 在向后传递过程中，caffe 是否也为学习率为零(lr_mult = 0)的层计算梯度？
我最近使用 D-X-Y C++ 实现训练了 Faster R-CNN 模型 ( https://github.com/D-X-Y/caffe-faster-rcnn/ )。为了节省训练时间，我通过设置
machine-learning - 使用我自己的网络在caffe上训练mnist :Message type "caffe.LayerParameter" has no field named "lr_mult"
我写了一个网络来在caffe上训练数据集MNIST，但遇到了错误:消息类型“caffe.LayerParameter”没有名为“blogs_lr”的字段。我在互联网上搜索了它，有人告诉我我将blogs

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章