gpt4 book ai didi

Kubernetes Job Pod 进入 "Unknown"状态

转载 作者:行者123 更新时间:2023-12-04 15:08:47 24 4
gpt4 key购买 nike

我正在使用部署在 Kubernetes 上的 K3s 发行版AWS 中的 Spot EC2 实例。

我已经安排了某个处理作业,有时这个作业正在终止并处于“未知”状态(作业代码异常终止)

kubectl describe pod <pod_name>

它显示了这个:

 State:          Terminated
Reason: Unknown
Exit Code: 255
Started: Wed, 06 Jan 2021 21:13:29 +0000
Finished: Wed, 06 Jan 2021 23:33:46 +0000

AWS 日志显示 CPU 消耗在崩溃前为 99%。从许多来源( 123 )我看到这可能是节点崩溃的原因但没有看到那个,可能是什么原因?

谢谢!

最佳答案

作业的实际状态是已终止,原因是未知。为了调试这种情况,您需要从作业创建的 Pod 中获取相关日志。

When a Job completes, no more Pods are created, but the Pods arenot deleted either. Keeping them around allows you to still view thelogs of completed pods to check for errors, warnings, or otherdiagnostic output.

为此,执行 kubectl describe job $JOB 以查看 Events 部分下的 Pod 名称,然后执行 kubectl logs $POD

如果这还不够,您可以尝试不同的方式来 Debug Pods ,例如:

  • 使用容器执行调试

  • 使用临时调试容器进行调试,或者

  • 通过节点上的 shell 进行调试

上述方法将为您提供更多信息,以延缓工作终止背后的实际原因。

关于Kubernetes Job Pod 进入 "Unknown"状态,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65608573/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com