gpt4 book ai didi

kubernetes - 使用 Google Container Engine (GKE) 和 Stackdriver 监控和提醒 Pod 状态或重启

转载 作者:行者123 更新时间:2023-12-04 01:11:05 25 4
gpt4 key购买 nike

有没有办法使用 Stackdriver 监控 GKE 集群中运行的 pod 状态和重启次数?

虽然我可以在 Stackdriver 中查看所有 pod 的 CPU、内存和磁盘使用指标,但似乎无法获取有关崩溃 pod 或副本集中的 pod 因崩溃而重新启动的指标。

我正在使用 Kubernetes 副本集来管理 Pod,因此它们在崩溃时会重新生成并使用新名称创建。据我所知,Stackdriver 中的指标由 pod-name 显示(这在 pod 的生命周期内是唯一的),这听起来并不明智。

在 pod 故障时发出警报听起来是一件很自然的事情,以至于听起来很难相信目前不支持此功能。我从 Stackdriver for Google Container Engine 获得的监控和警报功能似乎毫无用处,因为它们都绑定(bind)到生命周期可能非常短的 Pod。

因此,如果这不能开箱即用,是否有已知的解决方法或最佳实践来监控持续崩溃的 pod?

最佳答案

现在有一个内置指标,因此无需设置自定义指标即可轻松控制仪表板和/或发出警报

Metric: kubernetes.io/container/restart_count
Resource type: k8s_container

关于kubernetes - 使用 Google Container Engine (GKE) 和 Stackdriver 监控和提醒 Pod 状态或重启,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43789276/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com