- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
给定以下 3 个矩阵:
M = np.arange(35 * 37 * 59).reshape([35, 37, 59])
A = np.arange(35 * 51 * 59).reshape([35, 51, 59])
B = np.arange(37 * 51 * 51 * 59).reshape([37, 51, 51, 59])
C = np.arange(59 * 27).reshape([59, 27])
我使用einsum
来计算:
D1 = np.einsum('xyf,xtf,ytpf,fr->tpr', M, A, B, C, optimize=True);
但我发现它的性能要低得多:
tmp = np.einsum('xyf,xtf->tfy', A, M, optimize=True)
tmp = np.einsum('ytpf,yft->ftp', B, tmp, optimize=True)
D2 = np.einsum('fr,ftp->tpr', C, tmp, optimize=True)
我不明白为什么。
总的来说,我正在尽力优化这段代码。我已经阅读过有关 np.tensordot
函数的信息,但我似乎无法弄清楚如何将它用于给定的计算。
最佳答案
看起来您偶然发现了一种情况,其中贪婪
路径给出了非最佳缩放。
>>> path, desc = np.einsum_path('xyf,xtf,ytpf,fr->tpr', M, A, B, C, optimize="greedy");
>>> print(desc)
Complete contraction: xyf,xtf,ytpf,fr->tpr
Naive scaling: 6
Optimized scaling: 5
Naive FLOP count: 3.219e+10
Optimized FLOP count: 4.165e+08
Theoretical speedup: 77.299
Largest intermediate: 5.371e+06 elements
--------------------------------------------------------------------------
scaling current remaining
--------------------------------------------------------------------------
5 ytpf,xyf->xptf xtf,fr,xptf->tpr
4 xptf,xtf->ptf fr,ptf->tpr
4 ptf,fr->tpr tpr->tpr
>>> path, desc = np.einsum_path('xyf,xtf,ytpf,fr->tpr', M, A, B, C, optimize="optimal");
>>> print(desc)
Complete contraction: xyf,xtf,ytpf,fr->tpr
Naive scaling: 6
Optimized scaling: 4
Naive FLOP count: 3.219e+10
Optimized FLOP count: 2.744e+07
Theoretical speedup: 1173.425
Largest intermediate: 1.535e+05 elements
--------------------------------------------------------------------------
scaling current remaining
--------------------------------------------------------------------------
4 xtf,xyf->ytf ytpf,fr,ytf->tpr
4 ytf,ytpf->ptf fr,ptf->tpr
4 ptf,fr->tpr tpr->tpr
使用 np.einsum('xyf,xtf,ytpf,fr->tpr', M, A, B, C, Optimize="optimal")
应该可以让您以最佳性能运行。我可以看看这条边,看看贪婪能否捕获它。
关于python - 4 次矩阵乘法的 np.einsum 性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51475114/
我有 2 个数组,其中一个的大小为: A = np.random.uniform(size=(48, 1000000, 2)) 另一个是 B = np.random.uniform(size=(48)
似乎是 numpy 的 einsum功能不适用于 scipy.sparse矩阵。有没有其他方法可以做这些事情einsum可以处理稀疏矩阵吗? 回应@eickenberg 的回答:我想要的特定 eins
我有以下张量执行, np.einsum('k,pjqk,yzjqk,yzk,ipqt->it', A, B, C, D, E) 而且我注意到,当“z”或“q”在维度上扩展时,执行时间确实受到了影响,尽
考虑下面的 3 个数组: np.random.seed(0) X = np.random.randint(10, size=(4,5)) W = np.random.randint(10, size=
我有一个形状为 (n, n) 的矩阵 A 和另一个形状为 (p, n) 的矩阵 b。我需要得到一个矩阵 C 使得 C[i] = (A * b[i, np.newaxis, :]) * b[i, :,
随着最近对 Numpy (1.14) 的更新,我发现它破坏了我的整个代码库。这是基于将默认的 numpy einsum 优化参数从 False 更改为 True。 因此,以下基本操作现在失败了: a
我已经搜索了一种解决方案,使用 einsum 确定行数不相等但列数相等的 numpy 数组的距离。我尝试了各种组合,但唯一能成功的方法是使用以下代码。我显然遗漏了一些东西,文献和众多线程并没有让我更接
我很熟悉einsum在纽比的运作方式。pytorch也提供了类似的功能:torch.einsum()。在功能和性能方面有什么相同点和不同点?在Py火炬文档中提供的信息相当稀少,没有提供任何关于这方面的
我一直在尝试调试某个模型,该模型在重复几次的层中使用 torch.einsum 运算符。 在尝试分析训练期间模型的 GPU 内存使用情况时,我注意到某个 Einsum 操作显着增加了内存使用量。我正在
我正在尝试将三个数组 (A x B x A) 与维度 (19000, 3) x (19000, 3, 3) x (19000, 3) 相乘,这样最后我得到一个大小为 (19000) 的一维数组,所以我
我正在尝试潜入 einsum符号。此 question and answers帮了我很多。 但是现在我不能掌握einsum的机器计算外积时: x = np.array([1, 2, 3]) y = n
想象一下,我有整数,n,q和具有这些维度的向量/数组: import numpy as np n = 100 q = 102 A = np.random.normal(size=(n,n)) B =
我有两个包含兼容矩阵的 numpy 数组,想计算使用 numpy.einsum 的元素明智的外积.数组的形状是: A1 = (i,j,k) A2 = (i,k,j) 因此数组分别包含 i 个形状为 (
我想使用类似 np.dot 或(最好)np.einsum 的东西来有效地执行它们相同的功能,但使用备用 ufunc 而不是 np.multiply。例如,考虑这两个数组: >>> a array([[
我有两个包含兼容矩阵的 numpy 数组,想计算使用 numpy.einsum 的元素明智的外积.数组的形状是: A1 = (i,j,k) A2 = (i,k,j) 因此数组分别包含 i 个形状为 (
为什么这些输出不同?这是有意的行为吗?我使用的是 tensorflow 1.12 import tensorflow as tf matrix = tf.constant([[1, 2, 3],
我有以下 Einstein Sum (einsum) 表达式, import numpy as np x = np.random.rand(1,8,2,8,10) y = np.random.rand
是否有一种优雅的方法可以根据 einsum 的输入参数预先计算 np.einsum 结果的形状(无需运行计算)? # Given a, b and signature with # a.shape =
我已阅读 einsum manual和 ajcr 的 basic introduction 我在非编码环境中对爱因斯坦求和的经验为零,尽管我尝试通过一些互联网研究来弥补这一点(将提供链接,但还没有超过
我尝试寻找答案,但找不到我需要的东西。如果这是一个重复的问题,我们深表歉意。 假设我有一个形状为 (n, n*m) 的二维数组。我想要做的是这个数组与其转置的外部总和,从而产生形状为 (n*m, n*
我是一名优秀的程序员,十分优秀!