java - 容器中的JVM错误地计算处理器？-6ren

java - 容器中的JVM错误地计算处理器？

转载作者：行者123 更新时间：2023-12-01 13:20:30

24

4

我最近再次进行了一些研究，并偶然发现了这一点。在向 OpenJDK 团队提示之前，我想看看其他人是否观察到了这一点，或者不同意我的结论。

因此，众所周知，JVM 长期以来一直忽略应用于 cgroup 的内存限制。众所周知，它现在将它们考虑在内，从 Java 8 开始更新某些内容，以及 9 和更高版本。不幸的是，基于 cgroup 限制所做的计算是如此无用，以至于您仍然必须手动完成所有工作。请参阅谷歌和数百篇关于此的文章。

我几天前才发现的，并且没有在这些文章中阅读任何一篇文章，是 JVM 如何检查 cgroup 中的处理器数量。处理器计数用于决定用于各种任务的线程数，包括垃圾收集。所以正确理解很重要。

在 cgroup 中(据我所知，我不是专家)您可以设置可用 CPU 时间的限制(--cpus Docker 参数)。这仅限制时间，而不限制并行性。还有 cpu 份额(--cpu-shares Docker 参数)，这是在负载下分配 cpu 时间的相对权重。 Docker 将默认值设置为 1024，但这纯粹是一个相对比例。

最后，还有 cpu 集(--cpuset-cpus 用于 Docker)将 cgroup 和 Docker 容器显式分配给处理器的子集。这与其他参数无关，实际上会影响并行性。

因此，在检查我的容器可以并行运行多少线程时，据我所知，只有 cpu 集是相关的。 JVM 虽然忽略了这一点，而是使用 cpu 限制(如果设置)，否则 cpu 共享(假设 1024 默认为绝对比例)。恕我直言，这已经很错误了。它计算可用的 CPU 时间来调整线程池的大小。

在 Kubernetes 中情况变得更糟。 AFAIK 最佳实践是不设置 cpu 限制，以便集群节点具有高利用率。此外，您应该为大多数应用程序设置一个低 CPU 请求，因为它们大部分时间都处于空闲状态，并且您希望在一个节点上安排多个应用程序。 Kubernetes 将请求以毫 cpu 为单位设置为 cpu 份额，最有可能在 1000m 以下。 JVM 始终假设一个处理器，即使您的节点运行在某个 64 核 CPU 怪物上。

有没有人也观察过这一点？我在这里错过了什么吗？还是 JVM 开发人员在为 cpu 实现 cgroup 限制时实际上使事情变得更糟？

以供引用:

https://bugs.openjdk.java.net/browse/JDK-8146115

https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/#how-pods-with-resource-limits-are-run

cat /sys/fs/cgroups/cpu/cpu.share在容器内，本地或您选择的集群中，获取启动时使用的设置

最佳答案

作为大型服务(>15K 容器在自己的云中运行分布式 Java 应用程序)的开发者，我也承认所谓的“Java 容器支持”还远非完美。同时，我可以理解实现当前资源检测算法的JVM开发人员的推理。

问题是，运行容器化应用程序的云环境和用例太多，几乎不可能解决各种配置问题。对于 Kubernetes 中的大多数应用程序，您声称的“最佳实践”不一定适用于其他部署。例如。这绝对不是我们服务的常见情况，大多数容器需要一定的最低保证 CPU 资源量，因此也有一个不能超过的配额，以保证其他容器的 CPU。此策略适用于低延迟任务。 OTOH，您所描述的策略，更适合高吞吐量或批处理任务。

HotSpot JVM 中当前实现的目标是开箱即用地支持流行的云环境，并提供覆盖默认值的机制。

有一个email thread Bob Vandette 解释了当前的选择。还有一个comment在源代码中，描述了 JVM 为何查看 cpu.shares并将其除以 1024。

/*
 * PER_CPU_SHARES has been set to 1024 because CPU shares' quota
 * is commonly used in cloud frameworks like Kubernetes[1],
 * AWS[2] and Mesos[3] in a similar way. They spawn containers with
 * --cpu-shares option values scaled by PER_CPU_SHARES. Thus, we do
 * the inverse for determining the number of possible available
 * CPUs to the JVM inside a container. See JDK-8216366.
 *
 * [1] https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/#meaning-of-cpu
 *     In particular:
 *        When using Docker:
 *          The spec.containers[].resources.requests.cpu is converted to its core value, which is potentially
 *          fractional, and multiplied by 1024. The greater of this number or 2 is used as the value of the
 *          --cpu-shares flag in the docker run command.
 * [2] https://docs.aws.amazon.com/AmazonECS/latest/APIReference/API_ContainerDefinition.html
 * [3] https://github.com/apache/mesos/blob/3478e344fb77d931f6122980c6e94cd3913c441d/src/docker/docker.cpp#L648
 *     https://github.com/apache/mesos/blob/3478e344fb77d931f6122980c6e94cd3913c441d/src/slave/containerizer/mesos/isolators/cgroups/constants.hpp#L30
 */

至于并行性，我也第二个 HotSpot 开发者认为 JVM 应该采用 cpu.quota和 cpu.shares在估计可用 CPU 的数量时考虑在内。当容器分配了一定数量的 vcore 时(以任何一种方式)，它只能依赖于这个数量的资源，因为不能保证有更多的资源可供进程使用。考虑一个在 64 核机器上运行的具有 4 个 vcore 的容器。在 64 个并行线程中运行的任何 CPU 密集型任务(GC 就是此类任务的一个示例)将很快耗尽配额，并且操作系统将长时间限制容器。例如。 100 毫秒中的每 94 毫秒，应用程序都会处于停顿状态，因为记帐配额 ( cpu.cfs_period_us) 的默认周期是 100 毫秒。

无论如何，如果该算法在您的特定情况下无法正常工作，则始终可以使用 -XX:ActiveProcessorCount 覆盖可用处理器的数量。选项，或使用 -XX:-UseContainerSupport 完全禁用容器感知.

关于java - 容器中的JVM错误地计算处理器？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59661653/

24

4

0

文章推荐： r - 双泊松分布中的最大似然

文章推荐： tfs - NuGet 包仅在 TFS 管理的提要中显示为预发布

文章推荐： kubernetes - 公开 DaemonSet 服务以供同一节点上的 pod 使用

java - 是否有可能复制 JVM，以便我可以简单地从主 jvm 切换到辅助 jvm，以防主 jvm 出现故障
是否可以复制一个完整的 JVM，并且在故障转移的情况下只需将负载转移到复制的 JVM 上？如果是，那我们该怎么做呢？最佳答案如果您的应用程序是 Web 应用程序，请阅读“集群”和“负载平衡”。大
java - JVM 规范、JVM 实现、JVM 运行时之间有什么区别
我读了下面的话，但我想知道它们之间的区别...... JVM 规范、JVM 实现、JVM 运行时最佳答案 JVM 规范:描述 JVM 应如何运行的文档。 JVM 实现:基于 JVM 规范的 JVM
java - JVM 内存使用情况，一个带线程的 JVM 还是四个 JVM 用于我的四个应用程序？
我目前有四个不同的 java 应用程序，它们由 .bat 文件启动的 jar 运行，这些文件位于 Windows XP Embedded 开始菜单的 starup 文件夹中。我还启动了 Firefox
jvm - 强制 64 位 jvm 到 32 位 jvm？
有人能给我一些关于强制 64 位 jvm 作为 32 位 jvm 运行的想法吗？我需要为蓝牙连接编写一个 jse 桌面应用程序。为此，我需要实现 Bluecove jar 。它只有 32 位文件。所
jvm - 永久代是堆的一部分还是在 jvm 中位于自身的不同空间
我看到过关于这个问题的多条评论——有人说是，有人说不是，许多答案模棱两可。任何人都可以用更简单的术语描述它所在的位置吗？在一篇文章中，我什至看到有人说它与类加载器加载类的类内存共享相同的内存位置 -
jvm - 是否有完整的 JVM 退出代码列表
我正在寻找所有可能的 jvm 退出代码的完整列表(不是 java System.exit(x))。我使用搜索引擎唯一能找到的是 SIGTERM 退出代码列表:http://journal.thobe.
jvm - 监控 WebSphere JVM
为了监视任何正常的 Java 进程 JVM，我们可以使用 Attach API。是否有可用于监控 WebSphere JVM 的 API？最佳答案您可以使用 PMI(性能监控基础设施)来监控 JV
jvm - 如何 fork JVM？
这个问题在这里已经有了答案: 8年前关闭。 Possible Duplicate: Java - C-Like Fork? 我想知道如何从 JDK fork 子 JVM，甚至有可能这样做吗？一些框架
jvm - 哪些 JVM 语言是无堆栈的？
JVM 上的哪些图灵完备语言实现不使用 JVM 堆栈作为调用堆栈？ (我问是因为我想在同一个线程中实现 Scala 和另一种语言之间的协程。) 最佳答案闪蝶 SISC(方案代码的第二解释者) 曾经不
jvm - 为什么我们需要其他 JVM 语言
我看到here除了 Java 之外，还有很多语言可以在 JVM 上运行。我对在 JVM 中运行的其他语言的整个概念有些困惑。所以: 为 JVM 使用其他语言有什么优势？为 JVM 编写语言/编译器需
jvm - 寻找 JVM 堆的分配
我已经运行了 straced JVM (OpendJDK 11): strace -e trace=mmap java -Xms8192m Main 输出是: mmap(NULL, 8192, PRO
jvm - 寻找 JVM 堆的分配
我已经运行了 straced JVM (OpendJDK 11): strace -e trace=mmap java -Xms8192m Main 输出是: mmap(NULL, 8192, PRO
jvm - 为什么 JVM 在启动时随着时间的推移执行相同的程序会更快？
我编写了一个简单的数独求解器。为了粗略测试性能，我使用简单的 System.currentTimeMillis 调用。我在文本文件中准备了一组初始数独配置。该程序读取该文件并解决每个数独配置。运行测
jvm - 为什么 JVM 被认为是如此出色的软件工程？
JVM 被广泛使用:Scala、Groovy、Jython 等。我听说它被描述为“卓越”、“出色”和“严重低估”。为什么？更具体地说，是什么让 JVM 独一无二？随着所有资金投入 .NET，或者 C
jvm - 启动/停止 JVM
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: Are there any Java VMs which can save their state to a fi
jvm - 任意 JVM 行为
想象一下 6-7 台服务器的设置都完全相同Java 版本“1.6.0_18”OpenJDK 运行时环境 (IcedTea6 1.8) (fedora-36.b18.fc11-i386)OpenJDK
jvm - 什么启动 JVM 线程？
(如有错误请指正) 我了解到，当您通过发出 java 命令来运行 java 程序时， java MyProg 程序将在新的 JVM 上运行。什么将程序加载到新的 JVM 中？是生成新线程的 JRE
jvm - 是否可以指定 JVM 故障转储的位置？
我们有一个使用 JNI 的桌面应用程序偶尔会导致 JVM 崩溃。幸运的是，JVM 会生成一个 hs_err_pidXXXX.log 文件，这对于调试此类错误非常有用。然而，它似乎总是转到当前工作目录，
jvm - 自为 ActorSystem 启用 'akka.jvm-exit-on-fatal-error' 以来线程关闭 JVM 的未捕获错误
我在命令提示符下运行一个程序集 jar 文件并得到下面的异常。并导致终止。 Uncaught error from thread [ccp-akka.persistence.dispatchers.d
01、JVM 实战 - 初识 JVM
一、什么是Java虚拟机虚拟机：指以软件的方式模拟具有完整硬件系统功能、运行在一个完全隔离环境中的完整计算机系统，是物理机的软件实现。常用的虚拟机有VMWare，Visual Box，Java

首页

博学

6Ren·AI

商城

java - 容器中的JVM错误地计算处理器？