gpt4 book ai didi

go - golang select语句在for循环中的性能

转载 作者:IT王子 更新时间:2023-10-29 00:58:30 25 4
gpt4 key购买 nike

我测试了一下select的性能,发现结果不是好的。 go版本是1.7.3

package main

import (
"fmt"
"log"
"os"
"runtime/pprof"
"time"
)

var serverDone = make(chan struct{})
var serverDone1 = make(chan struct{})
var serverDone2 = make(chan struct{})
var serverDone3 = make(chan struct{})
var serverDone4 = make(chan struct{})
var serverDone5 = make(chan struct{})

func main() {
f, err := os.Create("cpu.pprof")
if err != nil {
log.Fatal(err)
}
pprof.StartCPUProfile(f)
defer pprof.StopCPUProfile()

for i := 0; i < 1000; i++ {
go messageLoop()
}
<-time.After(10 * time.Second)
close(serverDone)
fmt.Println("finished")
}

func messageLoop() {
var ticker = time.NewTicker(100 * time.Millisecond)
defer ticker.Stop()
var counter = 0
for {
select {
case <-serverDone:
return
case <-serverDone1:
return
// case <-serverDone2:
// return
// case <-serverDone3:
// return
// case <-serverDone4:
// return
// case <-serverDone5:
// return
case <-ticker.C:
counter += 1
}
}
}

当运行上面的代码时,你会发现每次添加一个serverDone case时,CPU都会上升(在我的书中,大约是5%)。
去掉所有serverDone的情况下,CPU占用率在5%左右,不太好。
如果我将全局锁定对象(如 serverDone)转到本地,性能会更好,但仍然不够好。

谁知道我的情况有什么问题,或者 select 语句的正确用法是什么?

最佳答案

简答: channel 使用互斥锁。更多的 channel 意味着更多的futex系统调用

这是程序上的 strace。

有 7 个 select 语句等待 7 个channels

的代码
% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
98.20 0.424434 13 33665 6061 futex
1.09 0.004731 10 466 sched_yield
0.47 0.002038 30 67 select
0.11 0.000484 4 114 rt_sigaction
0.05 0.000203 5 41 8 rt_sigreturn
0.03 0.000128 9 15 mmap
0.02 0.000081 27 3 clone
0.01 0.000052 7 8 rt_sigprocmask
0.01 0.000032 32 1 openat
0.00 0.000011 4 3 setitimer
0.00 0.000009 5 2 sigaltstack
0.00 0.000008 8 1 munmap
0.00 0.000006 6 1 execve
0.00 0.000006 6 1 sched_getaffinity
0.00 0.000004 4 1 arch_prctl
0.00 0.000004 4 1 gettid
0.00 0.000000 0 2 2 restart_syscall
------ ----------- ----------- --------- --------- ----------------
100.00 0.432231 34392 6071 total

包含 3 个 select 语句的代码等待 3 个channels

% time     seconds  usecs/call     calls    errors syscall
------ ----------- ----------- --------- --------- ----------------
90.47 0.118614 11 10384 1333 futex
6.64 0.008704 11 791 sched_yield
2.06 0.002706 23 120 select
0.39 0.000512 4 114 rt_sigaction
0.14 0.000181 8 22 2 rt_sigreturn
0.10 0.000131 9 15 mmap
0.05 0.000060 60 1 openat
0.04 0.000057 19 3 setitimer
0.04 0.000051 17 3 clone
0.03 0.000045 6 8 rt_sigprocmask
0.01 0.000009 9 1 execve
0.01 0.000009 5 2 sigaltstack
0.01 0.000009 9 1 sched_getaffinity
0.01 0.000008 8 1 munmap
0.01 0.000007 7 1 arch_prctl
0.00 0.000005 5 1 gettid
------ ----------- ----------- --------- --------- ----------------
100.00 0.131108 11468 1335 total

这里很明显,futex 调用的数量与 channel 的数量成正比,而 futex 系统调用是这种性能的原因。

这是对此的解释

您可以在以下文件中找到 channel 实现 src/runtime/chan.go .

这是 hchan channel 的结构

type hchan struct {
qcount uint // total data in the queue
dataqsiz uint // size of the circular queue
buf unsafe.Pointer // points to an array of dataqsiz elements
elemsize uint16
closed uint32
elemtype *_type // element type
sendx uint // send index
recvx uint // receive index
recvq waitq // list of recv waiters
sendq waitq // list of send waiters
lock mutex
}

在 runtime2.go 中定义了一个 Lock 嵌入式结构,它根据操作系统用作互斥锁 (futex) 或信号量。

因此随着 channel 数量的增加,会有更多的futex 系统调用 调用,这会影响性能

您可以在以下位置阅读更多相关信息:futex(2) , Channels in steroids

关于go - golang select语句在for循环中的性能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42059800/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com