- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
为什么这些基准测试结果如此不同?
func Benchmark1(b *testing.B) {
for n := 0; n < b.N; n++ {
_ = make([]byte, 8)
}
}
func Benchmark2(b *testing.B) {
length := 1
for n := 0; n < b.N; n++ {
_ = make([]byte, 7+length)
}
}
基准测试结果:
Benchmark1-8 500000000 3.37 ns/op
Benchmark2-8 30000000 50.6 ns/op
最佳答案
常量表达式8
在编译时被计算。 make
分配在 goroutine 堆栈上(便宜)。变量表达式 7 + length
在运行时计算。 make
分配在程序堆上(昂贵)。如果 make
大小对于堆栈分配来说太大(例如,常量 (64*1024)
和变量 (64*1024-1)+length
) 那么两个分配都是在堆上进行的,并且基准测试时间是相同的。
$ go tool compile -m a_test.go
a_test.go:5: Benchmark1 b does not escape
a_test.go:7: Benchmark1 make([]byte, 8) does not escape
a_test.go:14: make([]byte, 7 + length) escapes to heap
a_test.go:11: Benchmark2 b does not escape
$
a_test.go
:
package a
import "testing"
func Benchmark1(b *testing.B) {
for n := 0; n < b.N; n++ {
_ = make([]byte, 8)
}
}
func Benchmark2(b *testing.B) {
length := 1
for n := 0; n < b.N; n++ {
_ = make([]byte, 7+length)
}
}
去伪汇编:
$ go tool compile -S a_test.go
基准1:
"".Benchmark1 t=1 size=112 value=0 args=0x8 locals=0x20
0x0000 00000 (a_test.go:5) TEXT "".Benchmark1(SB), $32-8
0x0000 00000 (a_test.go:5) SUBQ $32, SP
0x0004 00004 (a_test.go:5) MOVQ "".b+40(FP), CX
0x0009 00009 (a_test.go:5) FUNCDATA $0, gclocals·87d20ce1b58390b294df80b886db78bf(SB)
0x0009 00009 (a_test.go:5) FUNCDATA $1, gclocals·790e5cc5051fc0affc980ade09e929ec(SB)
0x0009 00009 (a_test.go:6) MOVQ $0, AX
0x000b 00011 (a_test.go:6) NOP
0x000b 00011 (a_test.go:6) MOVQ 112(CX), BX
0x000f 00015 (a_test.go:6) CMPQ BX, AX
0x0012 00018 (a_test.go:6) JLE $0, 98
0x0014 00020 (a_test.go:7) MOVQ $0, BX
0x0016 00022 (a_test.go:7) MOVB BL, "".autotmp_0001(SP)
0x0019 00025 (a_test.go:7) MOVB BL, "".autotmp_0001+1(SP)
0x001d 00029 (a_test.go:7) MOVB BL, "".autotmp_0001+2(SP)
0x0021 00033 (a_test.go:7) MOVB BL, "".autotmp_0001+3(SP)
0x0025 00037 (a_test.go:7) MOVB BL, "".autotmp_0001+4(SP)
0x0029 00041 (a_test.go:7) MOVB BL, "".autotmp_0001+5(SP)
0x002d 00045 (a_test.go:7) MOVB BL, "".autotmp_0001+6(SP)
0x0031 00049 (a_test.go:7) MOVB BL, "".autotmp_0001+7(SP)
0x0035 00053 (a_test.go:7) LEAQ "".autotmp_0001(SP), BX
0x0039 00057 (a_test.go:7) CMPQ BX, $0
0x003d 00061 (a_test.go:7) JEQ $1, 103
0x003f 00063 (a_test.go:7) MOVQ $8, "".autotmp_0002+16(SP)
0x0048 00072 (a_test.go:7) MOVQ $8, "".autotmp_0002+24(SP)
0x0051 00081 (a_test.go:7) MOVQ BX, "".autotmp_0002+8(SP)
0x0056 00086 (a_test.go:6) INCQ AX
0x0059 00089 (a_test.go:6) NOP
0x0059 00089 (a_test.go:6) MOVQ 112(CX), BX
0x005d 00093 (a_test.go:6) CMPQ BX, AX
0x0060 00096 (a_test.go:6) JGT $0, 20
0x0062 00098 (a_test.go:9) ADDQ $32, SP
0x0066 00102 (a_test.go:9) RET
0x0067 00103 (a_test.go:7) MOVL AX, (BX)
0x0069 00105 (a_test.go:7) JMP 63
Benchmark2
:
"".Benchmark2 t=1 size=144 value=0 args=0x8 locals=0x58
0x0000 00000 (a_test.go:11) TEXT "".Benchmark2(SB), $88-8
0x0000 00000 (a_test.go:11) MOVQ (TLS), CX
0x0009 00009 (a_test.go:11) CMPQ SP, 16(CX)
0x000d 00013 (a_test.go:11) JLS 129
0x000f 00015 (a_test.go:11) SUBQ $88, SP
0x0013 00019 (a_test.go:11) FUNCDATA $0, gclocals·87d20ce1b58390b294df80b886db78bf(SB)
0x0013 00019 (a_test.go:11) FUNCDATA $1, gclocals·790e5cc5051fc0affc980ade09e929ec(SB)
0x0013 00019 (a_test.go:12) MOVQ $1, "".length+56(SP)
0x001c 00028 (a_test.go:13) MOVQ $0, AX
0x001e 00030 (a_test.go:13) MOVQ "".b+96(FP), BP
0x0023 00035 (a_test.go:13) NOP
0x0023 00035 (a_test.go:13) MOVQ 112(BP), BX
0x0027 00039 (a_test.go:13) MOVQ AX, "".n+48(SP)
0x002c 00044 (a_test.go:13) CMPQ BX, AX
0x002f 00047 (a_test.go:13) JLE $0, 124
0x0031 00049 (a_test.go:14) MOVQ "".length+56(SP), AX
0x0036 00054 (a_test.go:14) ADDQ $7, AX
0x003a 00058 (a_test.go:14) LEAQ type.[]uint8(SB), BX
0x0041 00065 (a_test.go:14) MOVQ BX, (SP)
0x0045 00069 (a_test.go:14) MOVQ AX, 8(SP)
0x004a 00074 (a_test.go:14) MOVQ AX, 16(SP)
0x004f 00079 (a_test.go:14) PCDATA $0, $0
0x004f 00079 (a_test.go:14) CALL runtime.makeslice(SB)
0x0054 00084 (a_test.go:14) MOVQ 24(SP), BX
0x0059 00089 (a_test.go:14) MOVQ BX, "".autotmp_0005+64(SP)
0x005e 00094 (a_test.go:14) MOVQ 32(SP), BX
0x0063 00099 (a_test.go:14) MOVQ BX, "".autotmp_0005+72(SP)
0x0068 00104 (a_test.go:14) MOVQ 40(SP), BX
0x006d 00109 (a_test.go:14) MOVQ BX, "".autotmp_0005+80(SP)
0x0072 00114 (a_test.go:13) MOVQ "".n+48(SP), AX
0x0077 00119 (a_test.go:13) INCQ AX
0x007a 00122 (a_test.go:13) NOP
0x007a 00122 (a_test.go:13) JMP 30
0x007c 00124 (a_test.go:16) ADDQ $88, SP
0x0080 00128 (a_test.go:16) RET
0x0081 00129 (a_test.go:11) CALL runtime.morestack_noctxt(SB)
0x0086 00134 (a_test.go:11) JMP 0
关于Golang : make slice performance,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33324912/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!