gpt4 book ai didi

python - 将 NumPy 数组映射到位

转载 作者:IT老高 更新时间:2023-10-28 20:30:38 24 4
gpt4 key购买 nike

是否可以在原地映射 NumPy 数组?如果是,如何?

给定 a_values - 2D 数组 - 这是目前对我有用的代码:

for row in range(len(a_values)):
for col in range(len(a_values[0])):
a_values[row][col] = dim(a_values[row][col])

但它是如此丑陋,以至于我怀疑在 NumPy 中的某个地方一定有一个函数可以对类似的东西做同样的事情:

a_values.map_in_place(dim)

但如果存在上述类似的东西,我一直找不到它。

最佳答案

只有在空间有限的情况下,才值得尝试就地执行此操作。如果是这种情况,可以通过迭代数组的扁平 View 来稍微加快代码速度。由于 reshape 返回一个新 View when possible ,数据本身不会被复制(除非原始数据具有不寻常的结构)。

我不知道有更好的方法来实现任意 Python 函数的真正就地应用。

>>> def flat_for(a, f):
... a = a.reshape(-1)
... for i, v in enumerate(a):
... a[i] = f(v)
...
>>> a = numpy.arange(25).reshape(5, 5)
>>> flat_for(a, lambda x: x + 5)
>>> a

array([[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14],
[15, 16, 17, 18, 19],
[20, 21, 22, 23, 24],
[25, 26, 27, 28, 29]])

一些时间安排:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> f = lambda x: x + 5
>>> %timeit flat_for(a, f)
1000 loops, best of 3: 1.86 ms per loop

它大约是嵌套循环版本的两倍:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> def nested_for(a, f):
... for i in range(len(a)):
... for j in range(len(a[0])):
... a[i][j] = f(a[i][j])
...
>>> %timeit nested_for(a, f)
100 loops, best of 3: 3.79 ms per loop

当然,vectorize 仍然更快,所以如果你可以复制,就使用它:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> g = numpy.vectorize(lambda x: x + 5)
>>> %timeit g(a)
1000 loops, best of 3: 584 us per loop

如果你可以使用内置的 ufunc 重写 dim,那么请不要vectorize:

>>> a = numpy.arange(2500).reshape(50, 50)
>>> %timeit a + 5
100000 loops, best of 3: 4.66 us per loop

numpy 就地执行 += 之类的操作,正如您所期望的那样——因此您可以免费获得具有就地应用程序的 ufunc 的速度.有时甚至更快!见 here举个例子。


顺便说一句,我对这个问题的原始回答(可以在其编辑历史中查看)是荒谬的,并且涉及将索引矢量化为 a。它不仅需要做一些时髦的事情来绕过vectorizetype-detection mechanism。 ,结果证明它和嵌套循环版本一样慢。这么多聪明!

关于python - 将 NumPy 数组映射到位,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6824122/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com