scala - 为什么 GraalVM CE 的吞吐量比 GraalVM EE 或 OpenJDK 8 小-6ren

scala - 为什么 GraalVM CE 的吞吐量比 GraalVM EE 或 OpenJDK 8 小

转载作者：行者123 更新时间：2023-12-04 19:26:49

26

4

我为使用动态编程找出最长公共(public)子序列的方法创建了一个基准:

@Benchmark
  def longestCommonSubsequenceDP(): String = {
    val s1 = "Pellentesque lacinia"
    val s2 = "Mauris purus massa"
    val up = 1
    val left = 2
    val charMatched = 3

    val s1Length = s1.length()
    val s2Length = s2.length()

    val lcsLengths = Array.fill[Int](s1Length + 1, s2Length + 1)(0)

    for (i <- 0 until s1Length) {
      for (j <- 0 until s2Length) {
        if (s1.charAt(i) == s2.charAt(j)) {
          lcsLengths(i + 1)(j + 1) = lcsLengths(i)(j) + 1
        } else {
          if (lcsLengths(i)(j + 1) >= lcsLengths(i + 1)(j)) {
            lcsLengths(i + 1)(j + 1) = lcsLengths(i)(j + 1)
          } else {
            lcsLengths(i + 1)(j + 1) = lcsLengths(i + 1)(j)
          }
        }
      }
    }

    val subSeq = new StringBuilder()
    var s1Pos = s1Length
    var s2Pos = s2Length

    do {
      if (lcsLengths(s1Pos)(s2Pos) == lcsLengths(s1Pos -1)(s2Pos)) {
        s1Pos -= 1
      } else if (lcsLengths(s1Pos)(s2Pos) == lcsLengths(s1Pos)(s2Pos - 1)) {
        s2Pos -= 1
      } else {
        assert(s1.charAt(s1Pos - 1) == s2.charAt(s2Pos - 1))
        subSeq += s1.charAt(s1Pos - 1)
        s1Pos -= 1
        s2Pos -= 1
      }

    } while (s1Pos > 0 && s2Pos > 0)

    subSeq.toString.reverse
  }

并使用以下配置运行它 jmh:run -i 10 -wi 10 -f1 -t1并得到以下结果:

GraalVM EE 1.0.0-rc10

[info] Benchmark                        Mode  Cnt   Score   Error   Units
[info] LCS.longestCommonSubsequenceDP  thrpt   25  91.411 ± 4.355  ops/ms

GraalVM CE 1.0.0-rc10

[info] Benchmark                        Mode  Cnt   Score   Error   Units
[info] LCS.longestCommonSubsequenceDP  thrpt   25  26.741 ± 0.408  ops/ms

OpenJDK 1.8.0_192

[info] Benchmark                        Mode  Cnt   Score   Error   Units
[info] LCS.longestCommonSubsequenceDP  thrpt   25  45.216 ± 1.956  ops/ms

我还做了另一个测试，我创建了一个包含数千个对象的列表，对其进行了一些过滤和排序， thrpt在 GraalVM CE 上最小。

为什么会有这种差异？

最佳答案

您会得到不同的结果，因为您使用的运行时启用了不同的顶级 JIT 编译器。
除非另有说明(例如使用命令标志):

OpenJDK 1.8.0_192 使用 C2

GraalVM CE 1.0.0-rc10 使用 Graal 编译器。

GraalVM EE 1.0.0-rc10 使用企业版 Graal 编译器。

JIT 在运行时将您的代码编译成机器代码，这在很大程度上取决于原始代码、工作负载、JIT 配置、启用的优化等。

可以合理地预期 JIT 编译器的不同实现会在同一基准测试中显示不同的结果。

如果你问为什么 GraalVM CE 在这个特定的基准上没有显示出更好的结果，而不是关于一般差异的哲学问题；这是一个简短的解释。
所有编译器都擅长某些方面，例如 Graal 具有出色的转义分析和内联算法，这在使用抽象的代码上显示出很好的结果:分配对象、调用方法等。

这个特定的基准用整数填充一个数组并运行一个循环。这可能并不完全允许 Graal 做它擅长的事情。
所以，这是一个 C2 擅长的微基准测试的例子。您可能可以构建一个类似的基准，GraalVM CE 会显示出优于 OpenJDK 的优势(也许您可以尝试这个: http://www.graalvm.org/docs/examples/java-simple-stream-benchmark/)。

GraalVM 团队运行大量基准测试，这就是 GraalVM CE 更好的知识来源。然而，人们需要明白，将一组复杂的基准测试结果减少到一个数字对于评估任何特定代码及其工作负载的性能并不是最有意义的事情。人们应该始终努力评估他们的代码。

关于scala - 为什么 GraalVM CE 的吞吐量比 GraalVM EE 或 OpenJDK 8 小，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53798779/

26

4

0

文章推荐： regex - 用 ascii 连字符 "-"替换所有连字符类型

文章推荐： python - 在 PyTorch 中为批处理中的每个样本计算梯度

文章推荐： tensorflow - 具有自定义损失函数的多输入多输出 CNN

文章推荐： sql - Oracle like 和 between 一起使用

c++ - 测量忽略处理器速度的快速代码的性能/吞吐量？
有没有一种方法我可以编写一个“工具”来分析从 C/C++ 程序生成的 x86 汇编语言并以这种方式测量性能，无论我在 1GHz 还是 3GHz 上运行它都没有关系处理器？我在考虑更多的指令吞吐量？我
messagebroker - NATS 是否水平扩展(吞吐量)
我们正在使用 NATS 并使用 3+ 节点的集群。我们有几个生产者和许多消费者。消息大小很小 (~100bytes) 但是我们的吞吐量有点高。 ~40k/秒。所有流量都在 2x10gbps 绑定(bi
jmeter - 吞吐量 Controller 的目的？
我需要一些帮助才能使用 JMeter。我想记录两种不同的场景，比如点击 2 个不同的按钮。如果我尝试为 2 个用户运行，一个用户应该点击第一个按钮，另一个用户应该同时点击另一个按钮。我知道这是基本问
grpc - 如何最大化 grpc 吞吐量？
在 100Gb 网络上，我创建了一个服务器来监听 4 个端口，grpc 客户端可以达到 3GB+/s 的吞吐量。然而，当服务器监听一个端口时，grpc 客户端达到了 1GB/s 的吞吐量，即使我设置了
android - 处理程序数据 IO 吞吐量？
android Handlers可行的数据IO吞吐量是多少？足以在线程之间传递原始音频或视频吗？它应该是可持续的吗？我在 android Handler docs 中没有看到任何对此的引用, $WE
elasticsearch - 在多机上增加 rabbitmq 吞吐量
我正在使用 logstash 和 elasticsearch 构建日志系统。 RabbitMQ 用于在两个 logstash 之间排队日志消息。消息路径如下: source log -> logst
c# - 如何增加 UDPClient 吞吐量
我正在研究 .NET Core 在 Linux 机器上的性能。具体来说，确定框架本身可用的工具可能存在什么样的限制。我一直以 ~ 50,000 pps 的价格击中盒子。到目前为止，似乎 ~ 20,0
Linux 无盘客户端 nfs 吞吐量
我有一个使用 nfs 挂载的 gentoo 无盘客户端，看起来 nfs 的吞吐量很慢。 iperf 显示网络能够推送 770 Mb/s，hdparm 显示服务器上的 SATA 磁盘速度为 90 Mb/
Java 首选项 API 吞吐量
我正在使用 Java Preferences API 来存储 Swing 应用程序的窗口位置和大小。此时此刻，我正在监听窗口调整大小/重新定位事件并在每次更改时存储位置和大小。然而，这意味着如果用户慢
performance - 分析云数据流 BigQuery 吞吐量/流水线
我正在尝试弄清楚 DataFlow 如何扩展某些操作以及如何使其表现最佳。首先，我刚刚创建了一个简单的流程，它从 BigQuery 中读取数据(约 2500 万行，总共 30GB)，进行 JSON 提
java - 如何确定 JVM GC 吞吐量？
确定 Oracle Java 8 JVM 垃圾收集器吞吐量的最简单方法是什么，最好使用 JDK 命令行工具？通过 jstat 命令，我可以获得总的垃圾收集时间(GCT 列)。根据这个值的变化与GC日
java - 如何测试 HDFS I/O 吞吐量
我有一个 Java 程序，它使用 HDFS 数据输入/输出流读取文件并将内容写入新文件。我的目标是找出我的 HDFS 的 I/O 吞吐量。下面是执行读/写和计时的代码片段: long start =
networking - 定义做某事所需的时间(延迟、吞吐量、带宽)
我了解延迟 - 消息从发件人到收件人所需的时间 - 和带宽 - 在给定时间内可以传输的最大数据量 - 但我正在努力寻找合适的术语来描述相关事物: 如果协议(protocol)是基于对话的——负载在端点
python - 低 Apache/mod_wsgi 吞吐量
我有一个在 pesto、mod_wsgi 和 Apache 上运行的普通 WSGI 应用程序: def viewData(request): return Response("aaaaaaaa
azure - 写入 Azure Cosmos，吞吐量 RU
我们计划将 10000 个 JSON 文档写入 Azure Cosmos DB (MongoDB)，吞吐量单位重要吗？如果重要，我们可以增加批量负载并将其设置回较低的数字最佳答案是的，你可以做到。
azure - 写入 Azure Cosmos，吞吐量 RU
我们计划将 10000 个 JSON 文档写入 Azure Cosmos DB (MongoDB)，吞吐量单位重要吗？如果重要，我们可以增加批量负载并将其设置回较低的数字最佳答案是的，你可以做到。
apache-spark - Spark 流 + kafka 吞吐量
在我的 spark 应用程序中，我正在阅读 kafka 主题。该主题有 10 个分区，因此我创建了 10 个接收器，每个接收器一个线程。通过这样的配置，我可以观察到接收器的奇怪行为。这些消费者的平均利
amazon-web-services - AWS Dynamodb 吞吐量
关于 AWS DynamoDb 吞吐量，我有些无法理解的地方。让我们考虑强一致性读取。现在，我明白在这种情况下，1 个容量单位意味着我每秒最多可以读取 4KB 的数据。 “每秒”这一点让我有点困惑
amazon-web-services - AWS Lambda 吞吐量
来自 AWS Lambda 常见问题解答: Q: Is there a limit to the number of AWS Lambda functions I can execute at onc
linux kernel_v_4.X 降低了 TCP_UL 吞吐量
在内核版本 4.X 上运行 iperf tcp_ul 流量时，我观察到 tcp_ul 的吞吐量有所下降。任何人都知道，为什么会这样。最佳答案在内核版本 4.4 之后，他们修改了 TCP 拥塞控制算

首页

博学

6Ren·AI

商城

scala - 为什么 GraalVM CE 的吞吐量比 GraalVM EE 或 OpenJDK 8 小