- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章使用Go defer要小心这2个雷区!由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
大家好,我是煎鱼.
在 Go 语言中 defer 是一个非常有意思的关键字特性。例子如下:
输出结果是:
在前几天我的读者群内有小伙伴讨论起了下面这个问题:
读者群的聊天截图 。
简单来讲,问题就是针对在 for 循环里搞 defer 关键字,是否会造成什么性能影响?
因为在 Go 语言的底层数据结构设计上 defer 是链表的数据结构:
defer 基本底层结构 。
大家担心如果循环过大 defer 链表会巨长,不够 “精益求精”。又或是猜想会不会 Go defer 的设计和 Redis 数据结构设计类似,自己做了优化,其实没啥大影响?
今天这篇文章,我们就来探索循环 Go defer,造成底层链表过长会不会带来什么问题,若有,具体有什么影响?
开始吸鱼之路.
defer 性能优化 30% 。
在早年 Go1.13 时曾经对 defer 进行了一轮性能优化,在大部分场景下 提高了 defer 30% 的性能:
Go defer 1.13 优化记录 。
我们来回顾一下 Go1.13 的变更,看看 Go defer 优化在了哪里,这是问题的关键点.
以前和现在对比 。
在 Go1.12 及以前,调用 Go defer 时汇编代码如下:
在 Go1.13 及以后,调用 Go defer 时汇编代码如下:
从汇编的角度来看,像是原本调用 runtime.deferproc 方法改成了调用 runtime.deferprocStack 方法,难道是做了什么优化?
我们抱着疑问继续看下去.
defer 最小单元:_defer 。
相较于以前的版本,Go defer 的最小单元 _defer 结构体主要是新增了 heap 字段:
该字段用于标识这个 _defer 是在堆上,还是在栈上进行分配,其余字段并没有明确变更,那我们可以把聚焦点放在 defer 的堆栈分配上了,看看是做了什么事.
deferprocStack 。
这一块代码挺常规的,主要是获取调用 defer 函数的函数栈指针、传入函数的参数具体地址以及PC(程序计数器),这块在前文 《深入理解 Go defer》 有详细介绍过,这里就不再赘述了.
这个 deferprocStack 特殊在哪呢?
可以看到它把 d.heap 设置为了 false,也就是代表 deferprocStack 方法是针对将 _defer 分配在栈上的应用场景的.
deferproc 。
问题来了,它又在哪里处理分配到堆上的应用场景呢?
具体的 newdefer 是在哪里调用的呢,如下:
非常明确,先前的版本中调用的 deferproc 方法,现在被用于对应分配到堆上的场景了.
小结 。
优化在哪儿 。
主要优化在于其 defer 对象的堆栈分配规则的改变,措施是:编译器对 defer 的 for-loop 迭代深度进行分析.
如果 Go 编译器检测到循环深度(loopdepth)为 1,则设置逃逸分析的结果,将分配到栈上,否则分配到堆上.
以此免去了以前频繁调用 systemstack、mallocgc 等方法所带来的大量性能开销,来达到大部分场景提高性能的作用.
循环调用 defer 。
回到问题本身,知道了 defer 优化的原理后。那 “循环里搞 defer 关键字,是否会造成什么性能影响?” 。
最直接的影响就是这大约 30% 的性能优化直接全无,且由于姿势不正确,理论上 defer 既有的开销(链表变长)也变大,性能变差.
因此我们要避免以下两种场景的代码:
显式循环 。
第一个例子是直接在代码的 for 循环中使用 defer 关键字:
这个也是最常见的模式,无论是写爬虫时,又或是 Goroutine 调用时,不少人都喜欢这么写.
这属于显式的调用了循环.
隐式循环 。
第二个例子是在代码中使用类似 goto 关键字:
这种写法比较少见,因为 goto 关键字有时候甚至会被列为代码规范不给使用,主要是会造成一些滥用,所以大多数就选择其实方式实现逻辑.
这属于隐式的调用,造成了类循环的作用.
总结 。
显然,Defer 在设计上并没有说做的特别的奇妙。他主要是根据实际的一些应用场景进行了优化,达到了较好的性能.
虽然本身 defer 会带一点点开销,但并没有想象中那么的不堪使用。除非你 defer 所在的代码是需要频繁执行的代码,才需要考虑去做优化.
否则没有必要过度纠结,在实际上,猜测或遇到性能问题时,看看 PProf 的分析,看看 defer 是不是在相应的 hot path 之中,再进行合理优化就好.
所谓的优化,可能也只是去掉 defer 而采用手动执行,并不复杂。在编码时避免踩到 defer 的显式和隐式循环这 2 个雷区就可以达到性能最大化了.
原文地址:https://mp.weixin.qq.com/s/ZEsWa4xUb0a7tWemVZMXVw 。
最后此篇关于使用Go defer要小心这2个雷区!的文章就讲到这里了,如果你想了解更多关于使用Go defer要小心这2个雷区!的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
在考虑类初始化时,我们都知道进行子类初始化时,如果父类没有初始化要先初始化子类。然而事情并没有一句话这么简单。 首先看看Java中初始化触发的条件: (1)在使用new实例化对象,访问静态数据和方
我目前正在使用 Google O3D WebGL 框架开发应用程序,这是我第一次如此密集地使用 JavaScript。这些功能只完成了大约 20%,但应用程序本身已经开始占用大约 160 兆内存,而让
我是一名优秀的程序员,十分优秀!