gpt4 book ai didi

python - 添加零时奇怪的 numpy.sum 行为

转载 作者:IT老高 更新时间:2023-10-28 20:35:09 24 4
gpt4 key购买 nike

我了解数学上等效的算术运算如何由于数值错误(例如,以不同顺序求和 float )而导致不同的结果。

然而,令我惊讶的是,将零添加到 sum 会改变结果。我认为这始终适用于 float ,无论如何:x + 0. == x.

这是一个例子。我希望所有的行都完全为零。谁能解释一下为什么会这样?

M = 4  # number of random values
Z = 4 # number of additional zeros
for i in range(20):
a = np.random.rand(M)
b = np.zeros(M+Z)
b[:M] = a
print a.sum() - b.sum()

-4.4408920985e-16
0.0
0.0
0.0
4.4408920985e-16
0.0
-4.4408920985e-16
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
2.22044604925e-16
0.0
4.4408920985e-16
4.4408920985e-16
0.0

MZ 的较小值似乎不会发生这种情况。

我还确定了 a.dtype==b.dtype

这里还有一个例子,它也展示了 python 的内置 sum 的行为符合预期:

a = np.array([0.1,      1.0/3,      1.0/7,      1.0/13, 1.0/23])
b = np.array([0.1, 0.0, 1.0/3, 0.0, 1.0/7, 0.0, 1.0/13, 1.0/23])
print a.sum() - b.sum()
=> -1.11022302463e-16
print sum(a) - sum(b)
=> 0.0

我正在使用 numpy V1.9.2。

最佳答案

简答:您看到了两者之间的区别

a + b + c + d

(a + b) + (c + d)

因为 float 不准确所以不一样。

长答案: Numpy 实现了成对求和作为速度(它允许更容易矢量化)和舍入误差的优化。

numpy sum-implementation 可以找到here (函数 pairwise_sum_@TYPE@)。它基本上做了以下事情:

  1. 如果数组的长度小于 8,则执行常规的 for 循环求和。这就是为什么如果 W < 4 没有观察到奇怪的结果的原因。在您的情况下 - 在两种情况下都将使用相同的 for 循环求和。
  2. 如果长度在 8 到 128 之间,则在 8 个 bin 中累加总和 r[0]-r[7]然后将它们相加 ((r[0] + r[1]) + (r[2] + r[3])) + ((r[4] + r[5]) + (r[6] + r[7])) .
  3. 否则,它将递归地对数组的两半求和。

因此,在第一种情况下,您会得到 a.sum() = a[0] + a[1] + a[2] + a[3]在第二种情况下 b.sum() = (a[0] + a[1]) + (a[2] + a[3])这导致a.sum() - b.sum() != 0 .

关于python - 添加零时奇怪的 numpy.sum 行为,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30998305/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com