Swisscom Cloud 上的 Java 应用程序因 OOM 失败-6ren

Swisscom Cloud 上的 Java 应用程序因 OOM 失败

转载作者：行者123 更新时间：2023-11-30 07:04:19

28

4

我们有可部署在 Swisscom Cloud 上的 Java 应用程序。具有 1.5 G RAM 的实例。我们正在使用 CF 的下一个参数来限制此应用程序的内存使用。

[jre: { version: 1.8.0_+ }, memory_calculator: {memory_sizes: {stack: 228k}, 
memory_heuristics: {heap: 50, metaspace: 20, native: 50, stack: 10}}]

在实例下，执行ps -ef | 时grep java 我们得到:

-Xms611500K -XX:MetaspaceSize=244600K -Xmx611500K -XX:MaxMetaspaceSize=244600K -Xss228
-XX:MaxDirectMemorySize=256m -XX:InitialCodeCacheSize=32m -XX:ReservedCodeCacheSize=64m 
-XX:CompressedClassSpaceSize=250m -XX:+UseCompressedOops -XX:+UseCompressedClassPointer

不幸的是，一段时间后我们的应用程序进程被终止(“退出状态为 137”)。我们尝试了 CF 的其他不同设置，但没有成功。尽管我们限制了使用的内存，但我们总是会用完 1.5 Gigs 的 RAM。

    2016-11-10T14:31:08.34+0200 [API/0]      OUT App instance exited with guid 
72a197e9-e222-43b5-9828-9553c1d58315 payload: {"instance"=>"", "index"=>0, 
"reason"=>"CRASHED", "exit_description"=>"2 error(s) occurred:\n\n* 2 error(s) 
occurred:\n\n* Exited with status 137 (out of memory)\n* cancelled\n* cancelled", 
"crash_count"=>1, "crash_timestamp"=>1478781068233690142, 
"version"=>"ebfced51-9973-434b-8ec0-79a8caa86b3b"}

在崩溃之前，我们使用 New Relic 分析堆内存使用情况，您可以在下面看到我们的发现:

这里，大约 4:30 发生了退出，状态为 137(内存不足)。正如您所看到的，内 stub 本没有超出。

当我在崩溃之前在 cf 实例下执行 top 命令时，我得到了下一个:

7 vcap 10 -10 6160764 1.357g 22528 S 27.3 7.4 3:09.52 java

实际上可能有什么问题？因为我看到java进程实际上使用了将近1.4G的RAM，但是从New Relic图表来看并没有使用这么大的内存量。

最佳答案

我假设您的应用程序正在崩溃，因为 CF 容器认为它使用了太多内存。可以通过查看“cf events”中的崩溃事件并确保它们是 OOM 崩溃来验证此假设。假设是容器导致应用程序崩溃，这就是我通常调整这种情况的方式。

java_buildpack 非常努力地控制应用程序的内存使用。然而，似乎仍然有一些应用程序的 jvm 找到了在配置选项之外分配内存的方法。

当我遇到这个问题时，调整配置的最简单方法就是继续增加“ native ”内存比率并减少堆，直到应用程序稳定下来。 Native 是 jvm 可能分配但 buildpack 无法管理的所有内容的包罗万象的存储桶。

我还会删除“heap:600m”配置，因为这只会使启发式计算更加复杂，并可能使增加 native 百分比无效。

关于Swisscom Cloud 上的 Java 应用程序因 OOM 失败，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/40407275/

28

4

0

文章推荐： javascript - 隐藏 Angular ng-repeat 的最后 2 条记录

文章推荐： javascript - 了解Promises/A +规范

文章推荐： javascript - jQuery 删除多个 Id 上的相同类

MySQL OOM 系统二 OOM Killer
这里就涉及到一个问题，到底Kill掉谁呢？一般稍微了解一些Linux内核的同学第一反应是谁用的最多，就Kill掉谁。这当然是Linux内核首先考虑的一种重要因素，但是也不完全是这样的，我们查一些Li
Java/OOM : How to dump all information on java heap space when it crashes due to OOM?
这个问题在这里已经有了答案: Set a JVM to dump heap when OutOfMemoryError is thrown (2 个答案) 关闭 5 年前。我是JAVA新手。我在用
多进程fitnesse测试环境中的Java OOM
我们正在使用 Fitnesse 对复杂的基于 Web 的应用程序进行验收测试。全套流程需要几个小时才能通过，因此我们使用多个流程。设置如下: maven fork Fitnesse 服务器进程 mav
tensorflow - GPU上的Tensorflow OOM
我正在Tensorflow的LSTM-RNN上训练一些音乐数据，并且遇到了我不明白的一些GPU内存分配问题:当实际上似乎还有足够的VRAM可用时，我遇到了OOM。一些背景: 我正在使用6GB的GTX
卡住图后的 Tensorflow OOM
我正在使用 tf 运行 seq2seq 模型，当使用 tf.train.Saver 从检查点文件加载参数时，推理程序运行良好。但是在使用 freeze_graph.py(使用 tf.framework
Javascript OOM，继承问题
我有一个问题需要用 JS 中的某种继承来解决。我设置了一个小的 jsfiddle 来解释，看: V1 http://jsfiddle.net/FFTj4/5/ function Vehicule(n
JavaScript OOM 错误
这里是 JS 的新手，所以如果我遗漏了一些明显的东西，我深表歉意。尝试构建一个随机数生成器(它以嵌套方式工作，所以有点像随机数元组列表)，但我收到此代码的 OOM 错误。 (比如，如果我尝试做类似 g
android - 从可绘制文件夹加载图像时通用图像加载器 OOM？
我有一个需要显示全屏图像的应用程序，我从可绘制文件夹中获取图像，它们大约为 150-250 kb，但它仍然崩溃并出现 OutOfMemory 错误。当然不是第一张图片，但每次用户启动应用程序时我都会加
postgresql - 在简单的读写上激发 OOM
我正在使用 spark 从 postgres 表中读取并将其作为 json 转储到 Google 云存储。该表很大，有数百个 GB。该代码相对简单(请参见下文)但因 OOM 而失败。似乎 spark
Tomcat 启动失败并出现 OOM
即使系统中有足够的内存并且正确提供了所有必需的内存设置，Tomcat 仍无法启动并出现 OOM。这种情况并没有持续发生，证明 tomact 配置没有问题。 15-Jan-2019 20:17:31.0
java - 高负载项目中的Java OOM
我在高负载多线程Java项目中遇到OOM异常问题。我很感激你能给我任何帮助。德莱尔斯：项目是建立在Java+Mysql作为存储。没有证据表明在应用程序崩溃时会使用额外的RAM（任何监控工具都不
linux - 即使有足够的可用内存也会调用 oom
我使用 Android P-OS。内核版本为msm-4.14 自启动以来，oom 被调用并终止进程。不过内存还是很丰富的。我的内存大小是8GByte，Swap是1GByte。我什至没有使用交换。 [
java - Tomcat多次重新部署Web应用后如何解决Metaspace OOM？
所有的一切，我正在使用 openjdk 1.8.0_212-b04、Tomcat 8.0.21 和 Red Hat 6.4。并且我已经调整了测试web应用程序，确保重新部署后不会有没有这样的消息:
带位图的 Android OOM
所以我在 Crashlytics 中看到我们有很多崩溃是由位图的 OOM 引起的。似乎其中 60% 来自 6.0.1 上的 Galaxy S7 Edge 设备。我们拥有的是一个包含 2 个图像的着陆屏
容器中的 Ruby OOM
最近我们在 Docker 容器中遇到了 Ruby 的问题。尽管负载非常低，但应用程序往往会消耗大量内存，并且在提到的一段时间后会出现 OOM。经过一番调查，我们将问题缩小到单线 docker run
Snakemake 显式处理内存不足 (OOM) 故障
Snakemake 工作流可以在任何类型的失败后重新尝试每次重启，包括如果错误是内存不足(OOM)，例如 def get_mem_mb(wildcards, attempt): return
Istio envoy 代理请求循环导致 OOM
我有一个有趣的问题。我想我发现了一个无限请求循环，它导致我的 istio-proxy 在特定情况下因 OOM 错误而崩溃。当我直接从应用程序容器内部将请求本地提交到应用程序时，它似乎工作正常，并且在
messaging - ActiveMQ 创建大量主题时抛出 OOME
我使用的是 ActiveMQ 5.2，我的应用程序需要大量主题，大约 500,000 个。当我运行我的应用程序时，仅创建大约 1000 个主题后，ActiveMQ 会抛出 OutOfMemoryExc
apache-spark - 结构化流 OOM
我在 k8s 运算符上部署了一个结构化流作业，它只是从 kafka 读取数据，反序列化，添加 2 列并将结果存储在数据湖中(尝试了 delta 和 parquet)，几天后执行程序增加了内存，最终我得
docker - 上载文件时Minio OOM(内存不足)
我的Mac上的Minikube中有一个本地Kubernetes集群。我将Minio独立服务器部署为具有指定资源限制的单个容器。当我上载大于容器内存限制的文件时，容器因OOMKilled原因终止。在Ub

首页

博学

6Ren·AI

商城

Swisscom Cloud 上的 Java 应用程序因 OOM 失败