- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我已经初始化了两个张量(矩阵):
sm=Var(torch.randn(20,1),requires_grad=True)
sm = torch.mm(sm,sm.t())
freq_m=Var(torch.randn(12,20),requires_grad=True)
我正在根据这两个矩阵内的数据创建两个列表,并且使用 Spearmanr 来获取这两个列表之间的相关值。如何创建列表并不重要,但目标是调整矩阵内的值,以便计算出的相关值尽可能接近 1。
如果我手动解决这个问题,我每次都会将矩阵中的值调整 0.01(或某个小数字),并重新计算列表和相关性得分。如果新的相关值高于前一个相关值,我将保存这 2 个矩阵并调整不同的值,直到获得能提供最高相关分数的 2 个矩阵。
PyTorch 能够自动执行此操作吗?我知道 PyTorch 可以根据方程进行调整,但我想要调整矩阵值的方式不是针对方程,而是针对我计算的相关值。非常感谢任何有关这方面的指导!
最佳答案
Pytorch 有一个 autograd 包,这意味着如果您有变量并且通过可微函数传递它们并获得标量结果,您可以执行梯度下降来更新变量以降低或增加标量结果。
因此,您需要做的是定义一个在张量级别上工作的函数 f,以便 f(sm, freq_m) 将为您提供所需的相关性。
然后,你应该这样做:
lr = 1e-3
for i in range(100):
# 100 updates
loss = 1 - f(sm, freq_m)
print(loss)
loss.backward()
with torch.no_grad():
sm -= lr * sm.grad
freq_m -= lr * freq_m.grad
# Manually zero the gradients after updating weights
sm.grad.zero_()
freq_m.grad.zero_()
学习率基本上就是你执行的步长的大小,学习率太高会导致损失爆炸,学习率太小会导致收敛缓慢,我建议你尝试一下。
编辑:回答对 loss.backward
的评论:对于任何可微函数 f,f 是多个张量 t1, ..., tn
的函数,其中 requires_grad=True
因此,您可以计算每个张量的损失梯度。当您执行loss.backward时,它会计算这些梯度并将其存储在t1.grad,...,tn.grad中。然后使用梯度下降更新t1, ..., tn
以降低 f 的值。此更新不需要计算图,因此这就是您使用与 torch.no_grad()
的原因。在循环结束时,您将梯度归零,因为 .backward
不会覆盖梯度,而是向其中添加新梯度。更多信息请参见:https://discuss.pytorch.org/t/why-do-we-need-to-set-the-gradients-manually-to-zero-in-pytorch/4903
关于python - 使用 PyTorch 根据我从张量计算的数字来调整张量矩阵值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57639434/
我想矢量化以下代码: def style_noise(self, y, style): n = torch.randn(y.shape) for i in range(n.shape[
对于给定的二维张量,我想检索值为 1 的所有索引。我希望能够简单地使用 torch.nonzero(a == 1).squeeze(),它将返回张量([1, 3, 2])。但是,torch.nonze
如果 x 是 dtype torch.float 的 torch.Tensor 那么操作 x.item() 和 float(x)完全一样? 最佳答案 操作x.item() 和float(x) 是不一样
我正在尝试提取 n 点 3D 坐标和 b 批处理中的特定行。本质上,我的张量 T1 的形状为 b*n*3。我有另一个形状为 b * n 的 bool 张量 T2,指示需要获取 n 的哪些行。本质上我的
以下代码掩码很好 mask = targets >= 0 targets = targets[mask] 但是,当我尝试使用两个条件进行屏蔽时,它会给出 RuntimeError: Boolean v
我正在定义一个简单的 conv2d 函数来计算输入和内核(均为 2D 张量)之间的互相关,如下所示: import torch def conv2D(X, K): h = K.shape[0]
作为训练 CNN 的一部分,我正在使用数组 inputs包含 对象。我想轮换一个人一些随机度数的对象 x ,如下所示: def rotate(inputs, x): # Rotate inpu
我有一个索引列表和一个具有形状的张量: shape = [batch_size, d_0, d_1, ..., d_k] idx = [i_0, i_1, ..., i_k] 有没有办法用索引 i_0
假设我有张量 t = torch.tensor([1,2,3,4,5]) 我想使用相同大小的索引张量来拆分它,该张量告诉我每个元素应该进行哪个拆分。 indices = torch.tensor([0
我尝试从生成器构建一个张量,如下所示: >>> torch.tensor(i**2 for i in range(10)) Traceback (most recent call last): F
假设我有一个一维 PyTorch 张量 end_index长度为L。 我想构造一个 2D PyTorch 张量 T有 L 行,其中 T[i,j] = 2什么时候j < end_index[i]和 T[
我在 pytorch 中有一个张量 x 比方说形状 (5,3,2,6) 和另一个形状 (5,3,2,1) 的张量 idx,其中包含第一个张量中每个元素的索引。我想用第二个张量的索引对第一个张量进行切片
我有以下火炬张量: tensor([[-0.2, 0.3], [-0.5, 0.1], [-0.4, 0.2]]) 以及以下 numpy 数组:(如有必要,我可以将其转换为其他内
tf.data.Dataset的构造函数接受一个参数 variant_tensor ,这只是 documented as : A DT_VARIANT tensor that represents t
我有: inp = torch.randn(4, 1040, 161) 我还有另一个名为 indices 的张量值: tensor([[124, 583, 158, 529], [1
我有一个张量 inps ,其大小为 [64, 161, 1]我有一些新数据d大小为 [64, 161] .如何添加 d至inps这样新的大小是[64, 161, 2] ? 最佳答案 使用 .unsqu
我有张量 t = torch.tensor([[1, 0, 0, 0], [0, 0, 1, 0], [0, 1, 0, 0], [1, 0, 0, 0]]) 和一个查询张量 q = torch.te
给定一个 3d 张量,说:batch x sentence length x embedding dim a = torch.rand((10, 1000, 96)) 以及每个句子的实际长度数组(或张
我想使用 [int, -1] 符号 reshape 张量(例如,压平图像)。但我事先并不知道第一个维度。一个用例是在大批量上进行训练,然后在较小的批量上进行评估。 为什么会出现以下错误:获取包含“_M
我有两个 torch 张量。一个形状为 [64, 4, 300],一个形状为 [64, 300]。我如何连接这两个张量以获得形状为 [64, 5, 300] 的合成张量。我知道用于此的 tensor.
我是一名优秀的程序员,十分优秀!