gpt4 book ai didi

scala - 关于复制案例类的表现

转载 作者:行者123 更新时间:2023-12-03 16:02:55 27 4
gpt4 key购买 nike

我有两个案例类:addSmalladdBig .addSmall只包含一个字段。addBig包含多个字段。

case class AddSmall(set: Set[Int] = Set.empty[Int]) {
def add(e: Int) = copy(set + e)
}

case class AddBig(set: Set[Int] = Set.empty[Int]) extends Foo {
def add(e: Int) = copy(set + e)
}

trait Foo {
val a = "a"; val b = "b"; val c = "c"; val d = "d"; val e = "e"
val f = "f"; val g = "g"; val h = "h"; val i = "i"; val j = "j"
val k = "k"; val l = "l"; val m = "m"; val n = "n"; val o = "o"
val p = "p"; val q = "q"; val r = "r"; val s = "s"; val t = "t"
}

使用 JMH 的快速基准测试表明复制 addBig即使我只更改一个字段,对象也会更加昂贵。
import java.util.concurrent.TimeUnit
import org.openjdk.jmh.annotations._

@State(Scope.Benchmark)
class AddState {
var elem: Int = _
var addSmall: AddSmall = _
var addBig: AddBig = _

@Setup(Level.Trial)
def setup(): Unit = {
addSmall = AddSmall()
addBig = AddBig()
elem = 1
}
}

@OutputTimeUnit(TimeUnit.MILLISECONDS)
@BenchmarkMode(Array(Mode.Throughput))
class SetBenchmark {
@Benchmark
def addSmall(state: AddState): AddSmall = {
state.addSmall.add(state.elem)
}

@Benchmark
def addBig(state: AddState): AddBig = {
state.addBig.add(state.elem)
}
}

结果显示复制 addBig比复制慢 10 倍以上 addSmall !
> jmh:run -i 5 -wi 5 -f1 -t1
[info] Benchmark Mode Cnt Score Error Units
[info] LocalBenchmarks.Set.SetBenchmark.addBig thrpt 5 10732.569 ± 349.577 ops/ms
[info] LocalBenchmarks.Set.SetBenchmark.addSmall thrpt 5 126711.722 ± 10538.611 ops/ms

为什么 addBig 复制对象要慢得多?
据我了解结构共享,由于所有字段都是不可变的,因此复制对象应该非常有效,因为它只需要存储更改(“delta”),在这种情况下只是集合 s ,因此应该提供与 addSmall 相同的性能.

编辑:当状态是案例类的一部分时,会出现相同的性能问题。
case class AddBig(set: Set[Int] = Set.empty[Int], a: String = "a", b: String = "b", ...) {
def add(e: Int) = copy(set + e)
}

最佳答案

我猜,这是因为 AddBig 类扩展了 Foo 特性,它具有所有这些 String 字段 - at 。看起来,在结果对象中,如果与 Java 相比,它们将被声明为常规字段,而不是 static 字段,因此为对象分配内存可能是复制性能变慢的根本原因。

更新 :
为了验证这个理论,您可以尝试使用 JOL(Java 对象布局)工具 - openjdk.java.net/projects/code-tools/jol

下面是简单的代码示例:

import org.openjdk.jol.info.{ClassLayout, GraphLayout}
println(ClassLayout.parseClass(classOf[AddSmall]).toPrintable())
println(ClassLayout.parseClass(classOf[AddBig]).toPrintable())

println(GraphLayout.parseInstance(AddSmall()).toPrintable)
println(GraphLayout.parseInstance(AddBig()).toPrintable)

在我的情况下,它产生了下一个输出(答案可读性的简短版本):
xample.AddSmall object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 12 (object header) N/A
12 4 scala.collection.immutable.Set AddSmall.set N/A
Instance size: 16 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total

example.AddBig object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 12 (object header) N/A
12 4 scala.collection.immutable.Set AddBig.set N/A
16 4 java.lang.String AddBig.a N/A
20 4 java.lang.String AddBig.b N/A
24 4 java.lang.String AddBig.c N/A

Instance size: 96 bytes
Space losses: 0 bytes internal + 0 bytes external = 0 bytes total

example.AddSmall@ea1a8d5d object externals:
ADDRESS SIZE TYPE PATH VALUE
770940b28 16 example.AddSmall (object)
770940b38 470456 (something else) (somewhere else) (something else)
7709b38f0 16 scala.collection.immutable.Set$EmptySet$ .set (object)


example.AddBig@480bdb19d object externals:
ADDRESS SIZE TYPE PATH VALUE
770143658 24 java.lang.String .h (object)
770143670 24 [C .h.value [h]
770143688 15536 (something else) (somewhere else) (something else)
770147338 24 java.lang.String .m (object)
770147350 24 [C .m.value [m]
770147368 1104264 (something else) (somewhere else) (something else)
770254cf0 24 java.lang.String .r (object)
770254d08 24 [C .r.value [r]
770254d20 7140768 (something else) (somewhere else) (something else)
7709242c0 24 java.lang.String .a (object)

因此,您可以看到来自父特征的字段也成为类字段,因此将与对象一起复制。

希望这可以帮助!

关于scala - 关于复制案例类的表现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60341018/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com