gpt4 book ai didi

sungridengine - 确保 Star Cluster/SunGridEngine (AGE) 上的每个节点一个作业

转载 作者:行者123 更新时间:2023-12-04 06:15:15 26 4
gpt4 key购买 nike

qsub在 StarCluster/SGE 集群上处理作业,是否有一种简单的方法可以确保每个节点一次最多接收一个作业?我遇到了多个作业最终在同一节点上导致内存不足 (OOM) 问题的问题。

我尝试使用 -l cpu=8但我认为这不会检查使用的内核数,而只是检查盒子本身的内核数。

我也试过 -l slots=8但后来我得到:

Unable to run job: "job" denied: use parallel environments instead of requesting slots explicitly.

最佳答案

在您的配置文件 (.starcluster/config) 中添加以下部分:

[plugin sge]
setup_class = starcluster.plugins.sge.SGEPlugin
slots_per_host = 1

关于sungridengine - 确保 Star Cluster/SunGridEngine (AGE) 上的每个节点一个作业,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25672896/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com