- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我今天在使用 PyTorch 时遇到了一个奇怪的问题。
在检查 with
范围中的网络参数时,我期望 requires_grad
为 False
,但显然情况并非如此,除非我我自己显式设置所有参数。
代码
链接到网络 -> Gist
net = InceptionResnetV2()
with torch.no_grad():
for name, param in net.named_parameters():
print("{} {}".format(name, param.requires_grad))
上面的代码将告诉我所有参数仍然需要 grad,除非我明确指定 param.requires_grad = False
。
我的torch
版本:1.0.1.post2
最佳答案
torch.no_grad()
将禁用涉及 requires_grad
设置为 True 的张量的操作结果的梯度信息
。因此请考虑以下事项:
import torch
net = torch.nn.Linear(4, 3)
input_t = torch.randn(4)
with torch.no_grad():
for name, param in net.named_parameters():
print("{} {}".format(name, param.requires_grad))
out = net(input_t)
print('Output: {}'.format(out))
print('Output requires gradient: {}'.format(out.requires_grad))
print('Gradient function: {}'.format(out.grad_fn))
这会打印
weight True
bias True
Output: tensor([-0.3311, 1.8643, 0.2933])
Output requires gradient: False
Gradient function: None
如果你用 torch.no_grad() 删除,你会得到
weight True
bias True
Output: tensor([ 0.5776, -0.5493, -0.9229], grad_fn=<AddBackward0>)
Output requires gradient: True
Gradient function: <AddBackward0 object at 0x7febe41e3240>
请注意,在这两种情况下,模块参数都将 requires_grad
设置为 True
,但在第一种情况下,out
张量没有与之相关的梯度函数,而在第二种情况下则如此。
关于python - 即使使用 torch.no_grad(),params 的 require_grad 也是 True,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54682457/
我收到“CUDA 内存不足”错误,然后我将 torch.no_grad() 函数添加到我的代码中。这会影响我的准确性吗? for iters in range(args.iterations): wi
我知道使用 pytorch,您可以通过在模型上调用 eval() 来关闭训练。您还可以设置requires_grad=False。 如何确保 TensorFlow 元素在训练期间不被修改? 最佳答案
假设 autograd 已打开(默认情况下),执行以下操作是否有任何区别(除了缩进): with torch.no_grad(): 和 torch.set_grad_enabled(Fals
我正在关注 PyTorch tutorial它使用 Huggingface Transformers 库中的 BERT NLP 模型(特征提取器)。有两段我不明白的梯度更新相关代码。 (1) torc
with torch.no_grad(): input = Variable(input).cuda() target = Variable(target).cuda(non_bloc
我的 torch 计划此时停止了我想我不能使用 volatile=True 我应该如何更改它以及停止的原因是什么? 以及我应该如何更改此代码? images = Variable(images.cud
with torch.no_grad(): input = Variable(input).cuda() target = Variable(target).cuda(non_bloc
我的 torch 计划此时停止了我想我不能使用 volatile=True 我应该如何更改它以及停止的原因是什么? 以及我应该如何更改此代码? images = Variable(images.cud
当我想评估模型在验证集上的性能时,是否首选使用 with torch.no_grad: 还是 model.eval()? 最佳答案 TL;博士: Use both 。他们做不同的事情,并且有不同的范围
import torch def model(x, W, b): return x@W + b def mse(t1, t2): diff = t1 - t2 return t
在编写机器学习模型时,我发现自己需要计算指标,或者为了可视化目的在回调中运行额外的前向传递。在 PyTorch 中,我使用 torch.no_grad() 执行此操作,这会阻止计算梯度,因此这些操作不
在 PyTorch 中测试网络时,可以使用 with torch.no_grad():。什么是 Libtorch (C++) 等价物?谢谢! 最佳答案 LibTorch 中的等价物是 torch::N
我今天在使用 PyTorch 时遇到了一个奇怪的问题。 在检查 with 范围中的网络参数时,我期望 requires_grad 为 False,但显然情况并非如此,除非我我自己显式设置所有参数。 代
我是一名优秀的程序员,十分优秀!