python - nn.Linear 的输出对于相同的输入是不同的-6ren

python - nn.Linear 的输出对于相同的输入是不同的

转载作者：行者123 更新时间：2023-12-04 14:48:41

30

4

在 torch==1.7.1+cu101 中，我有两个张量

import torch
a = torch.rand(1,5,10)
b = torch.rand(100,1,10)

和一个前馈网络

import torch.nn as nn
l = nn.Linear(10,10)

我强制其中一行相等:

a[0,0] = b[80][0].clone()

然后我将两个张量都提供给 l:

r1 = l(a)
r2 = l(b)

显然，由于 a[0,0] 等于 b[80,0]，r1[0,0] < strong>必须等于 r2[80,0]。但事实证明是这样的:

(r1[0,0] == r2[80,0]).all()
>>> False

我已经通过以下方式修复了随机性:

seed = 42

random.seed(seed)
os.environ['PYTHONHASHSEED'] = str(seed)
np.random.seed(seed)
torch.manual_seed(seed)
torch.cuda.manual_seed(seed)
torch.cuda.manual_seed_all(seed)
torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = True

有谁知道为什么 (r1[0,0] == r2[80,0]).all() 是 False？

最佳答案

如果您要打印 r1[0, 0] 和 r2[80, 0]，您会发现它们非常相似。甚至在打印位数上完全相同。

但是，如果您打印 r1[0, 0] - r2[80, 0]，您会发现生成的条目并不完全是 0.0(尽管它们接近它)，这意味着 r1[0, 0] 和 r2[80, 0] 接近但不完全相同。

现在，如果我们要先取出这些单独的向量，然后像这样将它们传递给线性层:

r1_small = l(a[0, 0])
r2_small = l(b[80, 0])
print((r1_small == r2_small).all())  # tensor(True)

我们知道它们完全相同，即使是 float 也是如此。

因此，这意味着相同的向量在通过线性层时是较大张量的较小部分会引入一些差异。

同样值得注意的是，当前 n-1 个维度都是 2 的幂时，不会出现相同的差异:

a2 = torch.randn(8, 8, 10)
b2 = torch.randn(4, 16, 10)
a2[0, 0] = b2[1, 0].clone()
r1_2 = l(a2)
r2_2 = l(b2)
print((r1_2[0, 0] == r2_2[1, 0]).all())  # tensor(True)

所以，虽然我不知道细节，但我怀疑它与 byte alignment 有关.

一般来说，测试在数学上应该相等的浮点值之间的完全相等并不总能给出预期的结果。那么我们如何处理这些差异呢？您可以使用 torch.isclose或 torch.allclose检查不完全相等。

关于python - nn.Linear 的输出对于相同的输入是不同的，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69459859/

30

4

0

文章推荐： python - 按开始/结束时间戳对数据帧行进行分组

文章推荐： html - 如何仅保留底部轮廓(焦点边框)？

css - linear-gradient 等价于 moz-linear-gradient
我想替换以下特定于 Mozilla 的 CSS 规则: background: -moz-linear-gradient(center top , #F5F5F5, #E4E4E4); 使用标准 li
python - SciPy interp2d(linear) 结果不同于 MatLab interp2(linear)
我正在将 MatLab 程序转换为 Python，我无法理解为什么 scipy.interpolate.interp2d(linear) 给出的结果与 MatLab interp2(linear) 不
Java : linear algorithm but non-linear performance drop, 从何而来？
我目前在自然语言处理方面开发的应用程序存在严重的性能问题。基本上，对于给定的文本，它会收集各种数据并进行一些数字运算。对于每一个句子，它的作用完全相同。用于收集统计数据的算法不会随着先前读取的数据而
java - 安卓Java : Linear Layout vanishes when placed on another Linear Layout
我正在为一个基本的 Android 计算器开发水平 View ，我有一个名为 linearLayout2 的 LinearLayout > 我试图将它放在 linearLayout3 之上，其中包含数
css - -webkit-linear-gradient 和 -moz-linear-gradient 的不同结果
我为按钮的背景使用了一些 CSS，但它在 Firefox、Chrome 和 IE 中看起来不同。我正在使用 -webkit-linear-gradient 和 -moz-linear-gradien
javascript - -moz-linear-gradient 在 JQuery Slider 上添加 -webkit-linear-gradient 时中断
TL;DR -webkit-linear-gradient 正在打破 -moz-linear-gradient 听说是个难题，我使用的是带有两个 handle 的 Jquery Slider 插件，我
algorithm - C4.5 决策树 : can deeps be higher in linear separable data then non-linear separable?
我突然想到，例如，假设我们有二维 N 点的训练数据。我们知道我们总是可以天真地构建一个决策树，以便我们可以对每个数据点进行分类。 (可能我们过拟合了，深度可以到2N) 但是，我们知道如果数据集是线性可
r - 获取 x 值给定 y 值 : general root finding for linear/non-linear interpolation function
我对插值函数的一般求根问题感兴趣。假设我有以下 (x, y)数据: set.seed(0) x = x[i]) & (rroots <= x[i + 1])] ## next piece
linear-programming - 为已知解决方案添加约束会导致越界异常
我有一个线性优化目标来最大化 EE+FF，其中 EE 和 FF 每个都包含一些 C 和 D。使用我编写的代码，我可以让求解器找到: EE_quantity: 0, FF_quantity: 7 ..
linear-algebra - 优雅的下溢
我一直在寻找这个问题，但我无法理解这个问题的含义。问题: Write a program in any language to determine how your computer handles
linear-regression - 拟合回归后如何使用Seaborn的residplot？
我在 Python 中有一个简单的线性多元回归，如下所示: X_train,X_test,y_train,y_test=train_test_split(x_cols,df['Volume'],tes
linear-algebra - 线性代数在编程中的使用
关闭。这个问题是off-topic .它目前不接受答案。想改善这个问题吗？ Update the question所以它是 on-topic对于堆栈溢出。 10年前关闭。 Improve this
linear-algebra - 通用稀疏迭代求解器库
对于大型稀疏迭代(共轭梯度、MINRES、GMRES 等)线性代数系统求解，有哪些更好的库？我经常编写自己的程序，但我很想知道人们更喜欢哪种“现成的”软件包。我听说过 PETSc、TAUCS、IML+
linear-programming - 如何在GLPK中为变量编写if条件？
这是我的全部问题: 信息: *最大限度。总投资:125美元 *支付是购买的单位x支付/单位的总和 *每笔投资成本:买入成本+成本/单位x单位数量(如果您购买至少一个单位) *费用为每笔投资费用之和限
linear-programming - 在线性规划中将条件约束转换为线性约束
我有两个变量:x>= 0 和 y 二进制(0 或 1)，我有一个常数 z >= 0。如何使用线性约束来描述以下条件: If x = z then y = 1 else y = 0. 我试图通过定义另一
linear-programming - 可以通过变量索引一个集合吗？
我正在尝试做一些逻辑上应该可以做的事情。但是，我不确定如何在线性规划领域内做到这一点。我正在使用 ZMPL/SCIP，但这对大多数人来说应该是可读的。 set I := {1,2,3,4,5}; pa
linear-programming - 线性规划题
我正在为我的期中考试做准备，我正在解决算法书中的一些问题，但似乎无法弄清楚以下问题: 在实数 a 和 b 上找出线性规划的充分必要条件 max: x+y ax + by 0 (a) 是不可行的。 (b
linear-regression - Java非负多元线性回归库
我正在做一个 Java 项目，我必须计算一个多元线性回归，但我希望得到的参数是非负的。是否有现有的商业友好许可图书馆来做这样的事情？我一直在寻找非负最小二乘库，但没有成功。最佳答案好吧，我找不到任
linear-algebra - 稠密线性代数的应用
密集线性代数在现实世界中的常见应用是什么？使用线性代数作为人机之间的通用语言，可以轻松描述和高效计算许多问题。尽管这些系统通常需要稀疏矩阵的解，而不是稠密矩阵。违反此规则的常见应用有哪些？我很好奇
linear-algebra - 特征库中的广义特征值和向量
我如何找到广义特征值、向量使用 Eigen3 图书馆？在 Octave ，matlab，特征值函数的形式是:[V, lambda] = eig (A, B) . 我只能找到 this 类(cla

首页

博学

6Ren·AI

商城

python - nn.Linear 的输出对于相同的输入是不同的