gpt4 book ai didi

java - Java 中 Optional 的 GC 开销

转载 作者:塔克拉玛干 更新时间:2023-11-01 22:37:39 26 4
gpt4 key购买 nike

我们都知道在 Java 中分配的每个对象都会增加 future 垃圾收集周期的权重,并且 Optional<T>对象没有什么不同。我们经常使用这些对象来包装 nullable,从而使代码更安全,但代价是什么?

有没有人知道可选对象添加了什么样的额外 GC 压力与简单地返回空值,以及这对高吞吐量系统的性能有什么样的影响?

最佳答案

We all know that every object allocated in Java adds a weight into future garbage collection cycles,…

这听起来像是一个没人能否认的说法,但让我们看看垃圾收集器的实际工作,考虑现代 JVM 的常见实现以及分配对象对其的影响,尤其是像 Optional 这样的对象。通常具有临时性质的实例。

垃圾收集器的首要任务是识别仍然存在的对象。 “垃圾收集器”这个名称着重于识别垃圾,但垃圾被定义为无法访问的对象,而找出哪些对象无法访问的唯一方法是通过消除过程。所以第一个任务是通过遍历并标记所有可达的对象来解决的。因此,此过程的成本不取决于已分配对象的总量,而仅取决于仍可访问的对象。

第二个任务是使垃圾的内存可用于新的分配。所有现代垃圾收集器都不会对仍然可访问的对象之间的内存间隙感到困惑,而是通过清空一个完整的区域,将所有具有该内存的 Activity 对象转移到一个新位置并调整对它们的引用。在此过程之后,内存可作为整个 block 用于新分配。因此,这又是一个过程,其成本不取决于已分配对象的总量,而仅取决于(部分)仍然存活的对象。

因此,像一个临时的对象Optional如果在两个垃圾收集周期之间分配和放弃,可能根本不会对实际垃圾收集过程产生任何成本。

当然是一网打尽。每次分配都会减少可用于后续分配的内存,直到没有剩余空间并且必须进行垃圾收集。所以我们可以说,每次分配减少了两次垃圾收集运行之间的时间,其大小等于分配空间的大小除以对象大小。这不仅是一个相当小的部分,而且它仅适用于单线程场景。

在像 Hotspot JVM 这样的实现中,每个线程都为新对象使用一个线程本地分配缓冲区 (TLAB)。一旦它的 TLAB 满了,它就会从分配空间(又名伊甸园空间)中获取一个新的。如果没有可用的,将触发垃圾收集。现在所有线程都不太可能同时到达其 TLAB 的末尾。因此,对于此时在其 TLAB 中仍有剩余空间的其他线程,如果它们分配了更多仍适合剩余空间的对象,则不会有任何区别。

也许令人惊讶的结论是,并非每个分配的对象都会对垃圾收集产生影响,即,由不触发下一次 gc 的线程分配的纯本地对象可能是完全免费的。 p>

当然,这不适用于分配大量对象。分配大量 TLAB 会导致线程分配更多 TLAB,并最终比没有 TLAB 更早地触发垃圾收集。这就是为什么我们有类似 IntStream 的类允许在不分配对象的情况下处理大量元素,就像 Stream<Integer> 会发生的那样, 虽然将结果作为单个 OptionalInt 提供没有问题实例。正如我们现在所知,单个临时对象对 gc 的影响很小,如果有的话。

这甚至没有触及 JVM 的优化器,如果 Escape Analysis 证明对象是纯本地的,它可能会消除热点中的对象分配。

关于java - Java 中 Optional<T> 的 GC 开销,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54443944/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com