gpt4 book ai didi

python - 快速加权散点矩阵计算

转载 作者:行者123 更新时间:2023-11-28 16:31:50 24 4
gpt4 key购买 nike

In this question six months ago , jez 很好地帮我想出了行差外积的快速近似值,即:

K = np.zeros((len(X), len(X)))
for i, Xi in enumerate(X):
for j, Xj in enumerate(X):
dij = Xi - Xj
K += np.outer(dij, dij)

这有助于找到一种 Fisher 判别分析形式的散点矩阵计算。但是现在我正在尝试进行局部 Fisher 判别分析,其中每个外部产品都由一个矩阵 A 加权,该矩阵 A 具有有关该对位置的信息,因此新行是:

K += A[i][j] * np.outer(dij, dij)

不幸的是,上一个答案中提供的计算未加权散点矩阵的快速方法对此不起作用,据我所知,快速更改并不容易。

线性代数绝对不是我的强项,我不擅长想出这些东西。有什么快速计算成对行差外积加权和的方法?

最佳答案

这是一种向量化您指定的计算的方法。如果你做了很多这样的事情,那么可能值得学习如何使用“numpy.tensordot”。它根据标准的 numpy 广播将所有元素相乘,然后对用 kwrd“axes”给出的轴对求和。

代码如下:

# Imports
import numpy as np
from numpy.random import random

# Original calculation for testing purposes
def ftrue(A, X):
""
K = np.zeros((len(X), len(X)))
KA_true = np.zeros((len(X), len(X)))

for i, Xi in enumerate(X):
for j, Xj in enumerate(X):
dij = Xi - Xj
K += np.outer(dij, dij)
KA_true += A[i, j] * np.outer(dij, dij)
return ftrue

# Better: No Python loops. But, makes a large temporary array.
def fbetter(A, X):
""
c = X[:, None, :] - X[None, :, :]
b = A[:, :, None] * c # ! BAD ! temporary array size N**3
KA_better = np.tensordot(b, c, axes = [(0,1),(0,1)])
return KA_better

# Best way: No Python for loops. No large temporary arrays
def fbest(A, X):
""
KA_best = np.tensordot(A.sum(1)[:,None] * X, X, axes=[(0,), (0,)])
KA_best += np.tensordot(A.sum(0)[:,None] * X, X, axes=[(0,), (0,)])
KA_best -= np.tensordot(np.dot(A, X), X, axes=[(0,), (0,)])
KA_best -= np.tensordot(X, np.dot(A, X), axes=[(0,), (0,)])
return KA_best


# Test script
if __name__ == "__main__":

# Parameters for the computation
N = 250
X = random((N, N))
A = random((N, N))

# Print the error
KA_better = fbetter(A, X)
KA_best = fbest(A, X)

# Test against true if array size isn't too big
if N<100:
KA_true = ftrue(A, X)
err = abs(KA_better - KA_true).mean()
msg = "Mean absolute difference (better): {}."
print(msg.format(err))

# Test best against better
err = abs(KA_best - KA_better).mean()
msg = "Mean absolute difference (best): {}."
print(msg.format(err))

我的第一次尝试 (fbetter) 制作了一个大小为 NxNxN 的大型临时数组。第二次尝试 (fbest) 永远不会做出大于 NxN 的任何东西。这在 N~1000 时效果很好。

A timing test

此外,当输出数组较小时,代码运行速度更快。 enter image description here

我安装了 MKL,因此对 tensordot 的调用非常快并且可以并行运行。

感谢您的提问。这是一个很好的练习,提醒我避免制作大型临时数组的重要性。

关于python - 快速加权散点矩阵计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31145918/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com