gpt4 book ai didi

python - 为什么 for 循环比 numpy 的二维数组乘法更快

转载 作者:太空狗 更新时间:2023-10-30 01:38:02 25 4
gpt4 key购买 nike

考虑以下两个函数,它们基本上将小序列中的每个数字与较大序列中的每个数字相乘以构建二维数组,然后将数组中的所有值加倍。 noloop() 使用二维 numpy 数组的直接乘法并返回结果,而 loop() 使用 for 循环迭代 arr1 并逐渐建立一个输出数组。

import numpy as np

arr1 = np.random.rand(100, 1)
arr2 = np.random.rand(1, 100000)

def noloop():
return (arr1*arr2)*2

def loop():
out = np.empty((arr1.size, arr2.size))
for i in range(arr1.size):
tmp = (arr1[i]*arr2)*2
out[i] = tmp.reshape(tmp.size)
return out

我预计 noloop 即使对于少量迭代也会更快,但对于上述数组大小,loop 实际上更快:

>>> %timeit noloop()
10 loops, best of 3: 64.7 ms per loop
>>> %timeit loop()
10 loops, best of 3: 41.6 ms per loop

有趣的是,如果我在两个函数中删除 *2noloop 会更快,但只是稍微快一点:

>>> %timeit noloop()
10 loops, best of 3: 29.4 ms per loop
>>> %timeit loop()
10 loops, best of 3: 34.4 ms per loop

对这些结果是否有一个很好的解释,是否有一种明显更快的方法来执行相同的任务?

最佳答案

我无法重现您的结果,但我确实发现使用 numpy.multiply 可以显着提高速度(2 倍)。通过使用 out 参数,您可以利用内存已经分配的事实并消除 tmpout 的复制。

def out_loop():
out = np.empty((arr1.size, arr2.size))
for i in range(arr1.size):
np.multiply(arr1[i], arr2, out=out[i].reshape((1, arr2.size)))
out[i] *= 2
return out

我机器上的结果:

In [32]: %timeit out_loop()
100 loops, best of 3: 17.7 ms per loop

In [33]: %timeit loop()
10 loops, best of 3: 28.3 ms per loop

关于python - 为什么 for 循环比 numpy 的二维数组乘法更快,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28065633/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com