performance - Go:通过 slice slice (二维 slice )访问数组时出现意外性能-6ren

performance - Go:通过 slice slice (二维 slice )访问数组时出现意外性能

转载作者：IT王子更新时间：2023-10-29 01:19:57

28

4

我在 Go 中使用矩阵乘法进行一些性能实验并遇到了一些意想不到的结果。

版本 1:

func newMatrix(n int) [][]int {
    m := make([][]int, n)
    buf := make([]int, n*n)

    for i := range m {
        m[i] = buf[i*n : (i+1)*n]
    }

    return m
}

func mult1(m1, m2, res [][]int) [][]int {
    for i := range m1 {
        for k := range m1[0] {
            for j := range m2[0] {
                res[i][j] += m1[i][k] * m2[k][j]
            }
        }
    }

    return res
}

我从线性阵列创建多个表示矩阵行的 slice 。

版本 2:

func mult2(m1, m2, res []int, n int) []int {
    for i := 0; i < n; i++ {
        for k := 0; k < n; k++ {
            for j := 0; j < n; j++ {
                res[i*n+j] += m1[i*n+k] * m2[k*n+j]
            }
        }
    }

    return res
}

在这个版本中，我简单地使用一个线性数组并通过乘法对其进行索引。

将 2 个 2048x2048 矩阵相乘得到以下执行时间:

 version 1: 35.550813801s
 version 2: 19.090223468s

版本 2 的速度几乎是原来的两倍。

我使用以下方法进行测量:

start := time.Now()
mult(m1, m2, m3)
stop := time.Now()

我知道使用 slice 会提供另一层间接访问，这可能会影响缓存性能，但我没想到会有如此大的差异。不幸的是，我还没有找到任何适用于 Mac 的好工具，可以分析 Go 中的缓存效率，所以我不能确定这是否是导致性能差异的原因。

所以我想我问的是这种预期行为还是我遗漏了什么？

软硬件:转到版本 1.4.2 darwin/amd64；操作系统 X 10.10.3； 2 GHz 四核 i7。

最佳答案

您的版本 1 代码中的主要问题似乎是间接寻址。尽管两个版本中矩阵在内存中的布局相同，但使用间接寻址会导致:

为同一代码生成更多指令。编译器可能无法确定何时使用 SIMD 指令的打包版本(例如 SSE、AVX)。您可以通过转储汇编代码来验证这一点，查找 XMM 或 YMM 寄存器并检查操作寄存器的指令是否已打包。
您让编译器很难添加软件预取。因为是间接寻址，所以编译器很难检测到如何添加软件预取。您可以在汇编代码中查找 vprefetch 指令。
由于间接寻址，硬件预取器的效率会降低。您首先需要访问行起始地址，然后访问行元素，因此很难观察到硬件预取器应该只获取连续的地址。这只能通过像 perf 这样的分析来衡量。

因此对于版本 1，间接寻址 是主要问题。我还建议在多次迭代中运行这 2 个代码以消除缓存预热惩罚，因为我在上面解释过，这对于版本 1 来说可能更高。

关于performance - Go:通过 slice slice (二维 slice )访问数组时出现意外性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30154087/

28

4

0

文章推荐： git - 我如何使用 Git GUI 忽略文件？

文章推荐： c - 如何修剪SSD磁盘上的 block ？

文章推荐： file - 是否有一种独立于操作系统的方式来自动覆盖文件？

arrays - Go:数组的数组， slice 的数组，数组的 slice 和 slice 的 slice
试图自学，但发现很难找到示例，我的大脑已经陷入了困境。非常不确定 3 和 4，需要帮助才能使 5 正常工作。 package main import "fmt" func main () {
golang 为 slice slice (二维 slice )中的现有元素赋值
我有一个 slice ，它由字符串类型的 slice 组成。我希望能够为这片 slice 的各个元素赋值，不一定按顺序。然后，稍后，我希望能够更改任何特定元素的值。我已经阅读了有关 slice 的相同
go - 将整数 slice append 到整数 slice 的 slice 会修改被 append 的 slice
我正在尝试将整数 slice append 到由整数 slice 组成的 slice 。当我打印 slice 时，它按预期显示。但是，当我将 slice append 到一片 slice 时，内容会发
golang slice，用 slice[a :b:c] slice
我读了go slice usage and internals和 Slice和 Effective go#slice但是没有像这样用 3 个数字 slice 的方法:slice[a:b:c] 例如这段
pointers - Go 中的函数返回一个新的 slice 或指向第一个 slice 的底层数组的 slice ？
这个问题在这里已经有了答案: Are slices passed by value? (5 个答案) 关闭 8 个月前。如果可能的话，我正在努力使我的代码更具性能以节省内存我做了一些研究，但找不
Golang 类型在指向一种类型 slice 的指针 slice 与另一种类型 slice 之间的类型转换
我是 Golang 的新手。当我尝试它时，出现编译错误: cannot use a.B (type []*C) as type []Z in field value 代码: package main
go - 将 slice append 到 slice 的 slice
我有数据结构: type PosList []int type InvertedIndex struct { Capacity int Len int IndexList [
performance - Go:通过 slice slice (二维 slice )访问数组时出现意外性能
我在 Go 中使用矩阵乘法进行一些性能实验并遇到了一些意想不到的结果。版本 1: func newMatrix(n int) [][]int { m := make([][]int, n)
python slice() 函数 vs slice notation - 如何处理 slice() 中的空值？
文档涵盖了 slice() 的 3 种用法对象: obj[:stop] = obj[slice(stop)] obj[start:stop] = obj[slice(start, stop)] obj
Golang 结构字段与 slice 语义 : "has a" slice of structs vs "is a" slice of structs
我有以下表示网页的结构 type Webpage struct { url.URL references []url.URL } 我想将网站表示为网页的集合。我正在使用这个结构，但感觉
for-loop - 从 3 个单独的 slice (每个结构属性一个 slice )创建新的组合结构 slice 时索引超出范围
我有一个这样的结构: type Headers struct { header string valueFromCalculation string
go - slice slice 引用
我正在参观 Golang 网站，我正在尝试消化其中一个示例。目前还不清楚它是如何工作的: package main import "fmt" func main() { s := []int{
go - slice slice 的拆包
我很好奇解包 slice 并将它们作为参数发送给可变参数函数。假设我们有一个带有可变参数的函数: func unpack(args ...interface{}) 如果我们不想传入它工作的接口(in
go - 解析 msgpack 编码单个 slice 的 msgpack 编码 slice 时为空 slice
我正在尝试解码来自服务器的 gzip 响应，该响应是一个 msgpack 数组或最终被 gzip 压缩的 msgpack 数组。为了说明这一点，我的回复看起来像这样: gzip(msgpack([m
go - Go 语言中的 nil slice vs 非 nil slice vs 空 slice
我是 Go 编程的新手。我在 Go 编程书籍中读到 slice 由三部分组成:指向数组的指针、长度和容量。我很困惑: nil slice ( slice 没有可指向的底层数组，len = 0，cap
go - 调整 slice 大小-是否检查`len(slice)> 1`或`newCap> 2 * len(slice)`
在Go Programming Language书中，作者给出了append()函数的以下代码示例，该函数接受[]int和int作为参数，并将相应地处理调整大小: // gopl.io/ch4/app
javascript - 在String.prototype.slice()中，.slice(0,-0)和.slice(0,+0)应该输出相同的结果吗？
我在代码高尔夫游戏中尝试优化字符串复数时遇到了这个怪癖。我的想法是将字符串写成复数形式，然后使用 substr 有条件地切断最后一个字符: var counter = 1; var myText =
arrays - GoLang : Check if item from Slice 1 contains in Slice 2. 如果是，删除 Slice 2
我有一个字符串数组:slice1 [][]string。我使用 for 循环获得了我想要的值: for _, i := range slice1 { //[string1 string2] f
go - 将一个 slice 分成N个 slice
我正在尝试实现一个将 TCP 端口 slice 拆分为 x 个其他 slice 的功能。这些 slice 将发送给将扫描这些端口的工作人员，因此 x 由工作人员的数量设置。这是代码: // crea
go - 拆包 slice 时 slice
我有以下代码 func Sum(a []int) int { res := 0 for _, n := range a { res += n } ret

首页

博学

6Ren·AI

商城

performance - Go:通过 slice slice (二维 slice )访问数组时出现意外性能