gpt4 book ai didi

kubernetes - 如何监控 Kubernetes Pod 崩溃?

转载 作者:行者123 更新时间:2023-12-02 11:34:51 27 4
gpt4 key购买 nike

我在 Google Container Engine 集群中使用 Kubernetes,我可以在 Stackdriver 日志中看到其中一个 Pod 由于 OutOfMemory 异常而发生故障并自动重新启动。

是否有监控这些事件的标准方法?

我正在使用Heapster而且它似乎没有提供任何有关 Pod 关闭和重新启动的指标。

最佳答案

根据我们的 IT 系统管理员的说法,当前大多数针对 Pod 故障进行实时监控和警报的解决方案目前都不稳定或非常乏善可陈。

我们最终开发了一个小脚本,它使用 Slack.com 网络服务进行邮件通知等。

如果我的答案不是现成的一键解决方案,我很抱歉:-)

这是我们当前经验和搜索的真实反馈。

我预计在不久的将来该主题的进展会很快!

我们的代码(有效结果的简单解决方案):

https://github.com/OpenSensee/K8SWatch

关于kubernetes - 如何监控 Kubernetes Pod 崩溃?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44718158/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com