gpt4 book ai didi

centos - HPC 计算节点未运行作业

转载 作者:行者123 更新时间:2023-12-04 19:37:11 28 4
gpt4 key购买 nike

我没有很多信息,所以请让我知道我可以做些什么来诊断这个。

我的 HPC 有几个计算节点,我昨晚提交的一项作业在运行几个小时后暂停。我今天早上检查了qstat,发现自从我昨天上次检查以来,它没有任何进展。其他节点似乎可以正常处理作业。

我删除了该作业并重新提交了它,但它看起来好像在队列中,即使它前面没有安排其他作业。

gstat 显示它没有排队的进程,但节点处于事件状态。

qstat -s 说“未运行:排空系统以允许饥饿作业运行”

如果有帮助,这是在 CentOS 6.5 环境中设置的。

我还能做些什么来诊断这个问题?

最佳答案

事实证明,运行超过 24 小时的扭矩脚本会导致调度程序也提交的所有其他作业暂停。我们需要终止负责的工作,一切都恢复原状。

关于centos - HPC 计算节点未运行作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43255309/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com