pytorch 权重weight 与梯度grad 可视化操作-6ren

pytorch 权重weight 与梯度grad 可视化操作

转载作者：qq735679552 更新时间：2022-09-27 22:32:09

53

4

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章pytorch 权重weight 与梯度grad 可视化操作由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

pytorch 权重weight 与梯度grad 可视化

查看特定layer的权重以及相应的梯度信息

打印模型。

pytorch 权重weight 与梯度grad 可视化操作

观察到model下面有module的key，module下面有features的key， features下面有(0)的key，这样就可以直接打印出weight了。

在pdb debug界面输入p model.module.features[0].weight，就可以看到weight，输入 p model.module.features[0].weight.grad 就可以查看梯度信息.

中间变量的梯度 : .register_hook

pytorch 为了节省显存，在反向传播的过程中只针对计算图中的叶子结点(leaf variable)保留了梯度值(gradient)。但对于开发者来说，有时我们希望探测某些中间变量(intermediate variable) 的梯度来验证我们的实现是否有误，这个过程就需要用到 tensor的register_hook接口。

grads = {}def save_grad(name):    def hook(grad):        grads[name] = grad    return hookx = torch.randn(1, requires_grad=True)y = 3*xz = y * y# 为中间变量注册梯度保存接口，存储梯度时名字为 y。y.register_hook(save_grad("y"))# 反向传播 z.backward()# 查看 y 的梯度值print(grads["y"])

打印网络回传梯度。

net.named_parameters() 。

parms.requires_grad 表示该参数是否可学习，是不是frozen的；。

parm.grad 打印该参数的梯度值.

net = your_network().cuda()def train(): ... outputs = net(inputs)    loss = criterion(outputs, targets)    loss.backward() for name, parms in net.named_parameters():   print("-->name:", name, "-->grad_requirs:",parms.requires_grad,    " -->grad_value:",parms.grad)

查看pytorch产生的梯度

[x.grad for x in self.optimizer.param_groups[0]["params"]]

pytorch模型可视化及参数计算

我们在设计完程序以后希望能对我们的模型进行可视化，pytorch这里似乎没有提供相应的包直接进行调用，参考一些博客.

下面把代码贴出来:

import torchfrom torch.autograd import Variableimport torch.nn as nnfrom graphviz import Digraphdef make_dot(var, params=None):       if params is not None:        assert isinstance(params.values()[0], Variable)        param_map = {id(v): k for k, v in params.items()}     node_attr = dict(style="filled",                     shape="box",                     align="left",                     fontsize="12",                     ranksep="0.1",                     height="0.2")    dot = Digraph(node_attr=node_attr, graph_attr=dict(size="12,12"))    seen = set()     def size_to_str(size):        return "("+(", ").join(["%d" % v for v in size])+")"     def add_nodes(var):        if var not in seen:            if torch.is_tensor(var):                dot.node(str(id(var)), size_to_str(var.size()), fillcolor="orange")            elif hasattr(var, "variable"):                u = var.variable                name = param_map[id(u)] if params is not None else ""                node_name = "%s %s" % (name, size_to_str(u.size()))                dot.node(str(id(var)), node_name, fillcolor="lightblue")            else:                dot.node(str(id(var)), str(type(var).__name__))            seen.add(var)            if hasattr(var, "next_functions"):                for u in var.next_functions:                    if u[0] is not None:                        dot.edge(str(id(u[0])), str(id(var)))                        add_nodes(u[0])            if hasattr(var, "saved_tensors"):                for t in var.saved_tensors:                    dot.edge(str(id(t)), str(id(var)))                    add_nodes(t)    add_nodes(var.grad_fn)    return dot

我们在我们的模型下面直接进行调用就可以了，例如:

if __name__ == "__main__":    model = DeepLab(backbone="resnet", output_stride=16)    input = torch.rand(1, 3, 53, 53)    output = model(input)    g = make_dot(output)    g.view()    params = list(net.parameters())    k = 0    for i in params:        l = 1        print("该层的结构：" + str(list(i.size())))        for j in i.size():            l *= j        print("该层参数和：" + str(l))        k = k + l    print("总参数数量和：" + str(k))

模型部分可视化结果:

pytorch 权重weight 与梯度grad 可视化操作

参数计算:

pytorch 权重weight 与梯度grad 可视化操作

以上为个人经验，希望能给大家一个参考，也希望大家多多支持我.

原文链接：https://blog.csdn.net/qq_21980099/article/details/106329354 。

最后此篇关于pytorch 权重weight 与梯度grad 可视化操作的文章就讲到这里了,如果你想了解更多关于pytorch 权重weight 与梯度grad 可视化操作的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

53

4

0

文章推荐： pytorch 梯度NAN异常值的解决方案

文章推荐： python中的mysql数据库LIKE操作符详解

文章推荐： PyTorch 如何检查模型梯度是否可导

文章推荐：解决Mysql的left join无效及使用的注意事项说明

pytorch - PyTorch 为什么叫 PyTorch？
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 3 年前。此帖子于去年编辑
pytorch - 验证阶段完成后gpu内存仍然被占用，pytorch
据我所知，在使用 GPU 训练和验证模型时，GPU 内存主要用于加载数据，向前和向后。据我所知，我认为 GPU 内存使用应该相同 1) 训练前，2) 训练后，3) 验证前，4) 验证后。但在我的例子中
pytorch - PyTorch 中复数的矩阵乘法
我正在尝试在 PyTorch 中将两个复数矩阵相乘，看起来 the torch.matmul functions is not added yet to PyTorch library for com
pytorch - Pytorch 中软标签的交叉熵
我正在尝试定义二分类问题的损失函数。但是，目标标签不是硬标签0，1，而是0~1之间的一个 float 。 Pytorch 中的 torch.nn.CrossEntropy 不支持软标签，所以我想自己写
pytorch - PyTorch 数据集应该返回什么？
我正在尝试让 PyTorch 与 DataLoader 一起工作，据说这是处理小批量的最简单方法，在某些情况下这是获得最佳性能所必需的。 DataLoader 需要一个数据集作为输入。大多数关于 D
pytorch - Pytorch DataLoader迭代顺序是否稳定？
Pytorch Dataloader 的迭代顺序是否保证相同(在温和条件下)？例如: dataloader = DataLoader(my_dataset, batch_size=4,
pytorch - Pytorch NLLLOSS的理解
PyTorch 的负对数似然损失，nn.NLLLoss定义为: 因此，如果以单批处理的标准重量计算损失，则损失的公式始终为: -1 * (prediction of model for correct
pytorch - PyTorch:new_ones与1
在PyTorch中，new_ones()与ones()有什么区别。例如， x2.new_ones(3,2, dtype=torch.double) 与 torch.ones(3,2, dtype=to
pytorch - PyTorch 中复杂掩码的最大池化
假设我有一个矩阵 src带形状(5, 3)和一个 bool 矩阵 adj带形状(5, 5)如下， src = tensor([[ 0, 1, 2], [ 3, 4,
pytorch - PyTorch 如何在张量的每一行中随机设置固定数量的元素
我想知道如果不在第 4 行中使用“for”循环，下面的代码是否有更有效的替代方案？ import torch n, d = 37700, 7842 k = 4 sample = torch.cat([
pytorch - PyTorch 中的自定义损失函数
我有三个简单的问题。如果我的自定义损失函数不可微会发生什么？ pytorch 会通过错误还是做其他事情？如果我在我的自定义函数中声明了一个损失变量来表示模型的最终损失，我应该放 requires_
pytorch - PyTorch 中参数与张量的区别
我想知道 PyTorch Parameter 和 Tensor 的区别？现有answer适用于使用变量的旧 PyTorch？最佳答案这就是 Parameter 的全部想法。类(附加)在单个图像中
pytorch - Pytorch 中是否有一种方法可以以可以反向传播的方式计算唯一值的数量？
给定以下张量(这是网络的结果 [注意 grad_fn]): tensor([121., 241., 125., 1., 108., 238., 125., 121., 13., 117., 12
pytorch - Pytorch 线性模块类定义中的常量
什么是__constants__在 pytorch class Linear(Module):定义于 https://pytorch.org/docs/stable/_modules/torch/nn
pytorch - pytorch conv2d的源代码在哪里？
我在哪里可以找到pytorch函数conv2d的源代码？它应该在 torch.nn.functional 中，但我只找到了 _add_docstr 行，如果我搜索conv2d。我在这里看了: ht
pytorch - PyTorch 中的默认膨胀值
如 documentation 中所述在 PyTorch 中，Conv2d 层使用默认膨胀为 1。这是否意味着如果我想创建一个简单的 conv2d 层，我必须编写 nn.conv2d(in_chann
pytorch - PyTorch 如何实现反向卷积？
我阅读了 Pytorch 的源代码，发现它没有实现 convolution_backward 很奇怪。函数，唯一的 convolution_backward_overrideable 函数是直接引发错
pytorch - pytorch 中的一种热门编码
我对编码真的很陌生，现在我正在尝试将我的标签变成一种热门编码。我已经完成将 np.array 传输到张量，如下所示 tensor([4., 4., 4., 4., 4., 4., 4., 4., 4.
pytorch - PyTorch 中用于文本输入的卷积神经网络
我正在尝试实现 text classification model使用CNN。据我所知，对于文本数据，我们应该使用一维卷积。我在 pytorch 中看到了一个使用 Conv2d 的示例，但我想知道如何
pytorch - Pytorch 中类别不平衡的多标签分类
我有一个多标签分类问题，我正试图用 Pytorch 中的 CNN 解决这个问题。我有 80,000 个训练示例和 7900 个类；每个示例可以同时属于多个类，每个示例的平均类数为 130。问题是我的

首页

博学

6Ren·AI

商城

pytorch 权重weight 与梯度grad 可视化操作

pytorch 权重weight 与梯度grad 可视化

查看特定layer的权重以及相应的梯度信息

中间变量的梯度 : .register_hook

查看pytorch产生的梯度

pytorch模型可视化及参数计算

首页

博学

6Ren·AI

商城

pytorch 权重weight 与 梯度grad 可视化操作

pytorch 权重weight 与 梯度grad 可视化

查看特定layer的权重以及相应的梯度信息

中间变量的梯度 : .register_hook

查看pytorch产生的梯度

pytorch模型可视化及参数计算

pytorch 权重weight 与梯度grad 可视化操作

pytorch 权重weight 与梯度grad 可视化