- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我最近再次进行了一些研究,并偶然发现了这一点。在向 OpenJDK 团队提示之前,我想看看其他人是否观察到了这一点,或者不同意我的结论。
因此,众所周知,JVM 长期以来一直忽略应用于 cgroup 的内存限制。众所周知,它现在将它们考虑在内,从 Java 8 开始更新某些内容,以及 9 和更高版本。不幸的是,基于 cgroup 限制所做的计算是如此无用,以至于您仍然必须手动完成所有工作。请参阅谷歌和数百篇关于此的文章。
我几天前才发现的,并且没有在这些文章中阅读任何一篇文章,是 JVM 如何检查 cgroup 中的处理器数量。处理器计数用于决定用于各种任务的线程数,包括垃圾收集。所以正确理解很重要。
在 cgroup 中(据我所知,我不是专家)您可以设置可用 CPU 时间的限制(--cpus
Docker 参数)。这仅限制时间,而不限制并行性。还有 cpu 份额(--cpu-shares
Docker 参数),这是在负载下分配 cpu 时间的相对权重。 Docker 将默认值设置为 1024,但这纯粹是一个相对比例。
最后,还有 cpu 集(--cpuset-cpus
用于 Docker)将 cgroup 和 Docker 容器显式分配给处理器的子集。这与其他参数无关,实际上会影响并行性。
因此,在检查我的容器可以并行运行多少线程时,据我所知,只有 cpu 集是相关的。 JVM 虽然忽略了这一点,而是使用 cpu 限制(如果设置),否则 cpu 共享(假设 1024 默认为绝对比例)。恕我直言,这已经很错误了。它计算可用的 CPU 时间来调整线程池的大小。
在 Kubernetes 中情况变得更糟。 AFAIK 最佳实践是不设置 cpu 限制,以便集群节点具有高利用率。此外,您应该为大多数应用程序设置一个低 CPU 请求,因为它们大部分时间都处于空闲状态,并且您希望在一个节点上安排多个应用程序。 Kubernetes 将请求以毫 cpu 为单位设置为 cpu 份额,最有可能在 1000m 以下。 JVM 始终假设一个处理器,即使您的节点运行在某个 64 核 CPU 怪物上。
有没有人也观察过这一点?我在这里错过了什么吗?还是 JVM 开发人员在为 cpu 实现 cgroup 限制时实际上使事情变得更糟?
以供引用:
cat /sys/fs/cgroups/cpu/cpu.share
在容器内,本地或您选择的集群中,获取启动时使用的设置 最佳答案
作为大型服务(>15K 容器在自己的云中运行分布式 Java 应用程序)的开发者,我也承认所谓的“Java 容器支持”还远非完美。同时,我可以理解实现当前资源检测算法的JVM开发人员的推理。
问题是,运行容器化应用程序的云环境和用例太多,几乎不可能解决各种配置问题。对于 Kubernetes 中的大多数应用程序,您声称的“最佳实践”不一定适用于其他部署。例如。这绝对不是我们服务的常见情况,大多数容器需要一定的最低保证 CPU 资源量,因此也有一个不能超过的配额,以保证其他容器的 CPU。此策略适用于低延迟任务。 OTOH,您所描述的策略,更适合高吞吐量或批处理任务。
HotSpot JVM 中当前实现的目标是开箱即用地支持流行的云环境,并提供覆盖默认值的机制。
有一个email thread Bob Vandette 解释了当前的选择。还有一个comment在源代码中,描述了 JVM 为何查看 cpu.shares
并将其除以 1024。
/*
* PER_CPU_SHARES has been set to 1024 because CPU shares' quota
* is commonly used in cloud frameworks like Kubernetes[1],
* AWS[2] and Mesos[3] in a similar way. They spawn containers with
* --cpu-shares option values scaled by PER_CPU_SHARES. Thus, we do
* the inverse for determining the number of possible available
* CPUs to the JVM inside a container. See JDK-8216366.
*
* [1] https://kubernetes.io/docs/concepts/configuration/manage-compute-resources-container/#meaning-of-cpu
* In particular:
* When using Docker:
* The spec.containers[].resources.requests.cpu is converted to its core value, which is potentially
* fractional, and multiplied by 1024. The greater of this number or 2 is used as the value of the
* --cpu-shares flag in the docker run command.
* [2] https://docs.aws.amazon.com/AmazonECS/latest/APIReference/API_ContainerDefinition.html
* [3] https://github.com/apache/mesos/blob/3478e344fb77d931f6122980c6e94cd3913c441d/src/docker/docker.cpp#L648
* https://github.com/apache/mesos/blob/3478e344fb77d931f6122980c6e94cd3913c441d/src/slave/containerizer/mesos/isolators/cgroups/constants.hpp#L30
*/
cpu.quota
和
cpu.shares
在估计可用 CPU 的数量时考虑在内。当容器分配了一定数量的 vcore 时(以任何一种方式),它只能依赖于这个数量的资源,因为不能保证有更多的资源可供进程使用。考虑一个在 64 核机器上运行的具有 4 个 vcore 的容器。在 64 个并行线程中运行的任何 CPU 密集型任务(GC 就是此类任务的一个示例)将很快耗尽配额,并且操作系统将长时间限制容器。例如。 100 毫秒中的每 94 毫秒,应用程序都会处于停顿状态,因为记帐配额 (
cpu.cfs_period_us
) 的默认周期是 100 毫秒。
-XX:ActiveProcessorCount
覆盖可用处理器的数量。选项,或使用
-XX:-UseContainerSupport
完全禁用容器感知.
关于java - 容器中的JVM错误地计算处理器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59661653/
我为 4 套接字服务器的大对象( double 矩阵)编写 NUMA-aaware 缓存。我观察到套接字间通信是我的应用程序的瓶颈。因此,我希望不同套接字上的线程具有单独的矩阵缓存。我已将线程限制到特
这个问题在这里已经有了答案: 关闭 12 年前。 Possible Duplicate: Parsing JSON using C? 处理 JSON 的最佳 C 库是什么? http://www.j
我一直在使用递归 SpinTax 处理器,如 here 所示, 它适用于较小的字符串。然而,当字符串超过 20KB 时,它开始耗尽内存,这就成了一个问题。 如果我有这样的字符串: {Hello|How
C# 中是否有一个#define 允许我在编译时知道我是针对 x86 (Win32) 还是针对 x64 (Win64) 进行编译? 最佳答案 默认情况下没有办法做到这一点。原因是 C# 代码不是针对特
我不确定 SO 是否是提出这个问题的最佳场所。如果没有,请告诉我应该去哪个姊妹网站。 我一直在阅读一篇关于英特尔的可信执行技术 (TXT) 的论文,其中包含以下我似乎无法理解的文字: “英特尔创建了一
我需要一个工具来针对 执行 XSLT非常大 XML 文件。需要明确的是,我不需要任何东西来设计、编辑或调试 XSLT,只需执行它们即可。我正在使用的转换已经很好地优化了,但是大文件导致我尝试过的工具(
我正在学习Apache Camel。 能否请您解释一下关于Apache Camel的处理器,组件和端点之间的区别。 最佳答案 我建议所有刚接触Apache Camel的人阅读这篇文章,它很好地解释了C
我想知道在 Camel 处理器上获得同步的方法。 我在 docs 找到的唯一相关内容: Note that there is no concurrency or locking issue when
我看到这个 https://issues.apache.org/jira/browse/NIFI-78在 jira 上,但它引用了 java。有没有办法将 nifi 进程映射到服务器上的线程,以便我可
我有以下用例: 在一个应用程序中,我使用 X 线程消费一些消息,其中我有一个这样定义的 Consumer 实现: public interface Consumer { onMessage(
CPU12 处理器中是否有提供简单 NOT 功能的代码? 最佳答案 这应该是 the datasheet您正在寻找。没有可用的logical NOT,您必须自己编写代码。 关于assembly - 不
我对 Oracle XDK 中包含的 Java XSLT 处理器与 Oracle DB 中嵌入并由 SQL XMLtransform 函数使用的 XSLT 处理器之间的关系感到困惑。 这些是相同的野兽
我正在试用 Camel,发现它是一个方便的端点集成工具。我已经设置了以下实验性应用程序: 第一个端点是一个简单的 http-get 请求(在命令行上使用 curl)。这与使用 Jetty 的中央交换机
我正在为一个应用程序使用 Apache Camel 和 Spring Boot。我需要从目录中读取数据,然后解码读取的 xml,然后处理解码的对象以在其中设置更多数据,然后再次对其进行编码并将其发送到
我已经知道如何编写自定义处理器(扩展org.apache.nifi.processor.AbstractProcessor)。我已经使用了这种技术,并且也可以轻松创建自定义 org.apache.ni
是否有任何用 python 编写的 EasyList 处理器/解析器? http://easylist.adblockplus.org/en/ 最佳答案 找到了!就像一个月后:( http://adb
我有一个无法安装任何东西的开发(说来话长)。我只需要使用纯 HTML/浏览器 JS 进行开发,并且我想使用 CSS 预处理器。我喜欢 SCSS (SASS),但为了使用它,我必须在我的机器上安装 ru
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
对于新手来说,是直接从 ARM 处理器的数据表和用户手册开始,还是先了解一下 ARM 世界然后再继续? 最佳答案 当我开始使用一项(对我而言)新技术时,我首先会找到尽可能多的数据表和应用说明,然后直接
我使用 AMD FX X6 6300 型处理器。 (它支持虚拟化,我的 BIOS 设置为 ON) 我安装了“英特尔 x86 仿真器加速器”。当我尝试运行 Intel 加速器设置时,我得到该设置无法安装
我是一名优秀的程序员,十分优秀!