gpt4 book ai didi

python - 如何使用 numpy 改进我的自定义函数矢量化

转载 作者:行者123 更新时间:2023-12-04 14:05:56 25 4
gpt4 key购买 nike

我是 python 的新手,对矢量化更是新手。我试图向量化一个自定义相似度函数,该函数应返回输入数组中每一行之间的成对相似度矩阵。

进口:

import numpy as np
from itertools import product
from numpy.lib.stride_tricks import sliding_window_view

输入:

np.random.seed(11)

a = np.array([0, 0, 0, 0, 0, 10, 0, 0, 0, 50, 0, 0, 5, 0, 0, 10])
b = np.array([0, 0, 5, 0, 0, 10, 0, 0, 0, 50, 0, 0, 10, 0, 0, 5])
c = np.array([0, 0, 5, 1, 0, 20, 0, 0, 0, 30, 0, 1, 10, 0, 0, 5])

m = np.array((a,b,c))

输出:

custom_func(m)

array([[ 0, 440, 1903],
[ 440, 0, 1603],
[1903, 1603, 0]])

功能:

def custom_func(arr):
diffs = 0
max_k = 6

for n in range(1, max_k):

arr1 = np.array([np.sum(i, axis = 1) for i in sliding_window_view(arr, window_shape = n, axis = 1)])

# this function uses np.maximum and np.minimum to subtract the max and min elements (element-wise) between two rows and then sum up the entire of that subtraction
diffs += np.sum((np.array([np.maximum(arr1[i[0]], arr1[i[1]]) for i in product(np.arange(len(arr1)), np.arange(len(arr1)))]) - np.array([np.minimum(arr1[i[0]], arr1[i[1]]) for i in product(np.arange(len(arr1)), np.arange(len(arr1)))])), axis = 1) * n

diffs = diffs.reshape(len(arr), -1)

return diffs

该函数非常简单,它总结了 N 个滑动窗口中行的最大行和最小行之间的逐元素差异。这个函数比我今天发现矢量化之前使用的函数快得多(对于循环和 pandas 数据帧是的)。

我的第一个想法是想出一种方法来一次找到我的数组的最小值和最大值,因为我目前认为它必须执行两次,但我无法弄清楚如何。我当前的函数中还有一个 for 循环,因为我需要为多个 N 个滑动窗口执行此操作,但我不确定如何在没有循环的情况下执行此操作。

感谢任何帮助!

最佳答案

以下是您可以对代码应用的几种优化:

  • 使用 Numba 的 JIT 来加速计算并用嵌套循环替换 product 调用
  • 使用更高效的滑动窗口算法(更好的复杂度)
  • 避免在循环中多次计算productarrange
  • 减少分配的隐式临时数组(和数组 Numpy 调用)的数量
  • 不要计算diffs 的下三角部分,因为它总是对称
    (复制上三角部分即可)
  • 使用基于整数的索引而不是缓慢的浮点索引

这是结果代码:

import numpy as np
from itertools import product
from numpy.lib.stride_tricks import sliding_window_view
import numba as nb

@nb.njit
def custom_func_fast(arr):
h, w = arr.shape[0], arr.shape[1]
diffs = np.zeros((h, h), dtype=arr.dtype)
max_k = 6

for n in range(1, max_k):
arr1 = np.empty(shape=(h, w-n+1), dtype=arr.dtype)

for i in range(h):
# Efficient sliding window algorithm
assert w >= n
s = np.sum(arr[i, 0:n])
arr1[i, 0] = s
for j in range(n, w):
s -= arr[i, j-n]
s += arr[i, j]
arr1[i, j-n+1] = s

# Efficient distance matrix computation
for i in range(h):
for j in range(i+1, h):
s = 0
for k in range(w-n+1):
s += np.abs(arr1[i,k] - arr1[j,k])
diffs[i, j] += s * n

# Fill the lower triangular part
for i in range(h):
for j in range(i):
diffs[i, j] = diffs[j, i]

return diffs

生成的代码在我机器上的示例输入数组上快 290 倍

关于python - 如何使用 numpy 改进我的自定义函数矢量化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68517641/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com