- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的问题涉及 JVM 应用程序可以在多大程度上利用主机的 NUMA 布局。
我有一个 Akka 应用程序,其中参与者通过将传入数据与已加载到不可变(Scala)对象中的“通用”数据组合来同时处理请求。该应用程序在云中可以很好地扩展,使用许多双核 VM,但在单个 64 核机器上表现不佳。我认为这是因为公共(public)数据对象驻留在一个 NUMA 单元中,并且从其他单元同时访问的许多线程对于互连来说太多了。
如果我运行 64 个单独的 JVM 应用程序,每个应用程序包含 1 个参与者,那么性能又会很好。更温和的方法可能是运行与 NUMA 单元(在我的情况下为 8 个)一样多的 JVM 应用程序,让主机操作系统有机会将线程和内存保持在一起?
但是有没有更聪明的方法可以在单个 JVM 中实现相同的效果?例如。如果我用案例类的多个实例替换我的公共(public)数据对象,JVM 是否有能力将它们放置在最佳 NUMA 单元上?
更新:
我正在使用 Oracle JDK 1.7.0_05 和 Akka 2.1.4
我现在尝试使用 UseNUMA 和 UseParallelGC JVM 选项。在使用一个或几个 JVM 时,两者似乎都不会对缓慢的性能产生任何显着影响。我也尝试过使用 PinnedDispatcher 和 thre-pool-executor,但没有任何效果。我不确定配置是否有效,因为启动日志中似乎没有什么不同。
当我为每个工作人员(约 50 个)使用单个 JVM 时,最大的改进仍然存在。但是,这个问题似乎是在 FailureDector 注册 Akka 集群 JVM 之间“第一次心跳”的成功交换之前有很长的延迟(最多几分钟)。我怀疑这里还有其他一些我尚未发现的问题。我已经不得不增加 ulimit -u 因为我达到了默认的最大进程数(1024)。
只是为了澄清一下,我不是试图获得大量消息,只是试图让许多单独的参与者同时访问一个不可变对象(immutable对象)。
最佳答案
我认为,如果您确定问题不在消息处理算法中,那么您不仅应该考虑 NUMA 选项,还应该考虑整个环境。配置,从 JVM 版本开始(最新的更好,Oracle JDK 也大多比 OpenJDK 性能更好),然后是 JVM 选项(包括 GC、内存、并发选项等),然后是 Scala 和 Akka 版本(最新的候选版本和里程碑可能会更好)还有 Akka 配置。
来自 here你可以借所有重要的东西来得到50M messages per second of total throughput for Akka actors on contemporary laptops .
从来没有机会在 64 核服务器上运行这些基准测试 - 所以任何反馈都将不胜感激。
根据我的调查结果,ForkJoinPool
的当前实现可以提供帮助。当池中的线程数增加时,会增加消息发送延迟。对于参与者之间的响应请求调用率很高的情况,例如。 G。在我的笔记本电脑上,当池大小从 4 增加到 64 时,对于大多数执行程序服务(Scala 的 ForkJoinPool
、JDK 的 ForkJoinPool
、ThreadPoolExecutor
),这种情况下 Akka Actor 的消息发送延迟会增长 2-3 倍。
您可以通过运行 mvnAll.sh
来检查是否有任何差异。与 benchmark.parallelism
系统变量设置为不同的值。
关于scala - JVM的NUMA意识,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16802459/
是否可以复制一个完整的 JVM,并且在故障转移的情况下只需将负载转移到复制的 JVM 上? 如果是,那我们该怎么做呢? 最佳答案 如果您的应用程序是 Web 应用程序,请阅读“集群”和“负载平衡”。大
我读了下面的话,但我想知道它们之间的区别...... JVM 规范、JVM 实现、JVM 运行时 最佳答案 JVM 规范:描述 JVM 应如何运行的文档。 JVM 实现:基于 JVM 规范的 JVM
我目前有四个不同的 java 应用程序,它们由 .bat 文件启动的 jar 运行,这些文件位于 Windows XP Embedded 开始菜单的 starup 文件夹中。我还启动了 Firefox
有人能给我一些关于强制 64 位 jvm 作为 32 位 jvm 运行的想法吗? 我需要为蓝牙连接编写一个 jse 桌面应用程序。为此,我需要实现 Bluecove jar 。它只有 32 位文件。所
我看到过关于这个问题的多条评论——有人说是,有人说不是,许多答案模棱两可。任何人都可以用更简单的术语描述它所在的位置吗?在一篇文章中,我什至看到有人说它与类加载器加载类的类内存共享相同的内存位置 -
我正在寻找所有可能的 jvm 退出代码的完整列表(不是 java System.exit(x))。我使用搜索引擎唯一能找到的是 SIGTERM 退出代码列表:http://journal.thobe.
为了监视任何正常的 Java 进程 JVM,我们可以使用 Attach API。是否有可用于监控 WebSphere JVM 的 API? 最佳答案 您可以使用 PMI(性能监控基础设施)来监控 JV
这个问题在这里已经有了答案: 8年前关闭。 Possible Duplicate: Java - C-Like Fork? 我想知道如何从 JDK fork 子 JVM,甚至有可能这样做吗? 一些框架
JVM 上的哪些图灵完备语言实现不使用 JVM 堆栈作为调用堆栈? (我问是因为我想在同一个线程中实现 Scala 和另一种语言之间的协程。) 最佳答案 闪蝶 SISC(方案代码的第二解释者) 曾经不
我看到here除了 Java 之外,还有很多语言可以在 JVM 上运行。我对在 JVM 中运行的其他语言的整个概念有些困惑。所以: 为 JVM 使用其他语言有什么优势? 为 JVM 编写语言/编译器需
我已经运行了 straced JVM (OpendJDK 11): strace -e trace=mmap java -Xms8192m Main 输出是: mmap(NULL, 8192, PRO
我已经运行了 straced JVM (OpendJDK 11): strace -e trace=mmap java -Xms8192m Main 输出是: mmap(NULL, 8192, PRO
我编写了一个简单的数独求解器。为了粗略测试性能,我使用简单的 System.currentTimeMillis 调用。 我在文本文件中准备了一组初始数独配置。该程序读取该文件并解决每个数独配置。运行测
JVM 被广泛使用:Scala、Groovy、Jython 等。我听说它被描述为“卓越”、“出色”和“严重低估”。为什么? 更具体地说,是什么让 JVM 独一无二?随着所有资金投入 .NET,或者 C
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: Are there any Java VMs which can save their state to a fi
想象一下 6-7 台服务器的设置都完全相同Java 版本“1.6.0_18”OpenJDK 运行时环境 (IcedTea6 1.8) (fedora-36.b18.fc11-i386)OpenJDK
(如有错误请指正) 我了解到,当您通过发出 java 命令来运行 java 程序时, java MyProg 程序将在新的 JVM 上运行。 什么将程序加载到新的 JVM 中?是生成新线程的 JRE
我们有一个使用 JNI 的桌面应用程序偶尔会导致 JVM 崩溃。幸运的是,JVM 会生成一个 hs_err_pidXXXX.log 文件,这对于调试此类错误非常有用。然而,它似乎总是转到当前工作目录,
我在命令提示符下运行一个程序集 jar 文件并得到下面的异常。并导致终止。 Uncaught error from thread [ccp-akka.persistence.dispatchers.d
一、什么是Java虚拟机 虚拟机:指以软件的方式模拟具有完整硬件系统功能、运行在一个完全隔离环境中的完整计算机系统 ,是物理机的软件实现。常用的虚拟机有VMWare,Visual Box,Java
我是一名优秀的程序员,十分优秀!