pytorch - 激活梯度惩罚-6ren

pytorch - 激活梯度惩罚

转载作者：行者123 更新时间：2023-12-02 12:17:06

28

4

这是一个简单的神经网络，我试图在其中惩罚激活梯度的范数:

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=5)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=5)
        self.pool = nn.MaxPool2d(2, 2)
        self.relu = nn.ReLU()
        self.linear = nn.Linear(64 * 5 * 5, 10)

    def forward(self, input):
        conv1 = self.conv1(input)
        pool1 = self.pool(conv1)
        self.relu1 = self.relu(pool1)
        self.relu1.retain_grad()
        conv2 = self.conv2(relu1)
        pool2 = self.pool(conv2)
        relu2 = self.relu(pool2)
        self.relu2 = relu2.view(relu2.size(0), -1)
        self.relu2.retain_grad()
        return self.linear(relu2)

model = Net()
optimizer = torch.optim.SGD(model.parameters(), lr=0.001)

for i in range(1000):
    output = model(input)
    loss = nn.CrossEntropyLoss()(output, label)
    optimizer.zero_grad()
    loss.backward(retain_graph=True)

    grads = torch.autograd.grad(loss, [model.relu1, model.relu2], create_graph=True)

    grad_norm = 0
    for grad in grads:
        grad_norm += grad.pow(2).sum()

    grad_norm.backward()

    optimizer.step()

但是，它并没有产生预期的正则化效果。如果我对权重(而不是激活)执行相同的操作，效果会很好。我这样做对吗(就 pytorch 机械而言)？具体来说， grad_norm.backward() 调用中会发生什么？我只是想确保更新权重梯度，而不是激活梯度。目前，当我打印该行之前和之后的权重和激活的梯度时，两者都会发生变化 - 所以我不确定发生了什么。

最佳答案

我认为您的代码最终会在每个步骤中计算一些梯度两次。我还怀疑它实际上永远不会将激活梯度归零，因此它们会跨步骤累积。

一般来说:

x.backward() 计算 x 的梯度。计算图叶子(例如权重张量和其他变量)，以及wrt。显式标记有 retain_grad() 的节点。它将计算出的梯度累积在张量的 .grad 属性中。
autograd.grad(x, [y, z]) 返回 x 的梯度。 y 和 z 无论它们通常是否保留 grad。默认情况下，它还会在所有叶子的 .grad 属性中累积梯度。您可以通过传递 only_inputs=True 来防止这种情况。

我更喜欢仅在优化步骤中使用 backward() ，而当我的目标是获得“具体化”梯度作为中间值时，我更喜欢使用 autograd.grad()另一种计算。这样，我可以确保在完成处理后，张量的 .grad 属性中不会残留任何不需要的梯度。

import torch
from torch import nn
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=5)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=5)
        self.pool = nn.MaxPool2d(2, 2)
        self.relu = nn.ReLU()
        self.linear = nn.Linear(64 * 5 * 5, 10)

    def forward(self, input):
        conv1 = self.conv1(input)
        pool1 = self.pool(conv1)
        self.relu1 = self.relu(pool1)
        conv2 = self.conv2(self.relu1)
        pool2 = self.pool(conv2)
        self.relu2 = self.relu(pool2)
        relu2 = self.relu2.view(self.relu2.size(0), -1)
        return self.linear(relu2)


model = Net()
optimizer = torch.optim.SGD(model.parameters(), lr=0.001)
grad_penalty_weight = 10.

for i in range(1000000):
    # Random input and labels; we're not really learning anything
    input = torch.rand(1, 3, 32, 32)
    label = torch.randint(0, 10, (1,))

    output = model(input)
    loss = nn.CrossEntropyLoss()(output, label)

    # This is where the activation gradients are computed
    # only_inputs is optional here, since we're going to call optimizer.zero_grad() later
    # But it makes clear that we're *only* interested in the activation gradients at this point
    grads = torch.autograd.grad(loss, [model.relu1, model.relu2], create_graph=True, only_inputs=True)

    grad_norm = 0
    for grad in grads:
        grad_norm += grad.pow(2).sum()

    optimizer.zero_grad()
    loss = loss + grad_norm * grad_penalty_weight
    loss.backward()
    optimizer.step()

这段代码似乎可以工作，因为激活梯度确实变小了。我无法评论这种技术作为正则化方法的可行性。

关于pytorch - 激活梯度惩罚，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54727099/

28

4

0

文章推荐： openxml - 生成 OpenXML Excel 文件不应用日期格式

文章推荐： Kubernetes postStart 生命周期钩子(Hook) block CNI

文章推荐： kubernetes DNS - 让服务通过 DNS 联系自己

文章推荐： gruntjs - yeoman grunt-wiredep 不注入(inject)依赖项

jquery - Google.code 重力脚本(Mr.Doob)在鼠标移动时触发/激活，而不是在(文档).ready 时触发/激活
我目前正在使用发现的重力脚本 here为了在我的网页上创建重力效果，我正在本地开发 atm。我的问题是，重力效果的激活似乎是在鼠标移动时进行的，而我需要它在文档准备好时才触发。 google.cod
ruby-on-rails - 部署 Rails 应用程序时出错。 'can' t 激活 pg (~>0.18), 已经被 pg 1.0 激活
我正在尝试关注 Railsbridge Intallfest 并尝试将我的第一个 Rails 应用程序部署到 heroku。我不断收到以下错误消息: Gem::LoadError: Specified
php - 如何使该脚本在加载后几秒钟出现/激活？
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
jQuery:激活/悬停第一个选项卡
Home-tab 是默认选中的，但是它的颜色是灰色的:( Home Bla Contact
ios - 激活/停用方向变化的约束
我没有得到它的工作，我不知道为什么......遗憾的是其他问题 + 答案没有帮助。测试设备: iPhone 6 iPad 2 相关代码: override func viewWillTransiti
ios - 激活 UISearchBar
我试图加载一个 View ，就像用户已经按下 UISearchBar 一样。我希望 SearchController 加载顶部的 UISearchBar 以及取消按钮。我已经试过了: func ac
ios - 激活/停用代码
试图在 if whiteDotDist < centerRadius - whiteDotRadius 时获取代码执行它下面的所有代码都是事件的，并且当它下面的代码被执行时它再次变为非事件状态直到if
linux - python 激活
我正在使用 anaconda python。所以每次，在我的 mac 终端中，我输入终端命令: source /Users/mylaptop/anaconda/bin/activate /Users/
Angular SwUpdate 激活 deprication
在我的 Angular 项目中，我有这种代码: this.swUpdate.available.subscribe(() => { ... }); 它工作正常，但给了我关于 activated 被
julia - 激活 Julia 虚拟环境
我想弄清楚 Julia 包是如何工作的，因为我喜欢容器化环境。我真的很挣扎。在 python 中，我会做类似 conda create env --name ds 的事情创建环境然后安装容器化包我会
excel - Windows() 超出范围错误。激活
我的宏中有一些代码如下 ChDir File_pth Workbooks.Open filename:= File_pth & "\" & open_tkt Workbooks.Open filena
excel - 除非手动输入，否则使用串联形成的公式不会计算/激活
长话短说，我有两张纸，一张是“原始数据”，另一张是“结果”。我试图让结果表从“原始数据”表的每第七行中提取文本或数字，因此“结果”中的 A1 将是原始数据中的 A1，“结果”中的 A2 将是“原始数据
jQuery UI Accordion 激活
我不知道如何做到这一点，或者我是否可以做到这一点。我有一个 jQuery UI Accordion，多个部分，每个部分包含多个 anchor 标记，每个 anchor 标记都有一个唯一的字符串 id。
iphone - 激活 iPhone 键盘
我不敢相信我还没有找到任何关于此的文档，但我想知道如何命令键盘激活并接收来自它的输入。我可以找到在编辑文本字段时操作弹出键盘的所有示例。谢谢最佳答案您还可以使用 UIKeyInput 协议(pro
electron - 激活 Electron 生成器NSIS安装程序中的日志记录
我正在尝试为我的 Electron 应用程序生成NSIS安装程序的日志。为此，我创建了一个文件'logging.nsh'来定义LogSet和LogText宏。以下是logging.nsh文件的代码:
javascript - knockoutJS 激活/停用值输入
几周前，我开始使用 typescript 和 knockoutJS，我有一个具体的问题，但我有解决方案，它太丑了，我无法忍受，但无法从中得到任何更好的东西，有太多代码需要粘贴，但我会尽力描述我的问题:
django - 激活 virtualenv 时出错
当我尝试激活我的虚拟环境时收到此错误即源 ~/edu-venv/bin/activate -bash: /home/vagrant/edu-venv/bin/activate: No such fil
git - 激活 ADF 触发器而不发布
要创建触发器，似乎必须发布它才能生效。但是发布需要对“协作”分支进行 PR，这意味着我们甚至在测试触发器是否实际工作之前就必须创建一个 PR，并且还必须创建多个后续 PR，直到我们获得正确的触发器。
IntelliJ 上的 Hibernate 激活
我是最近的 IntelliJ Idea 用户，我不知道如何启用 Hibernate。当我右键单击我的项目时，Hibernate 不会出现在“添加框架支持”菜单中(实际上我唯一可以选择的技术是 Groo
git - 激活 ADF 触发器而不发布
要创建触发器，似乎必须发布它才能生效。但是发布需要对“协作”分支进行 PR，这意味着我们甚至在测试触发器是否实际工作之前就必须创建一个 PR，并且还必须创建多个后续 PR，直到我们获得正确的触发器。

首页

博学

6Ren·AI

商城

pytorch - 激活梯度惩罚