gpt4 book ai didi

configuration - slurm:也使用控制节点进行计算

转载 作者:行者123 更新时间:2023-12-01 12:42:01 29 4
gpt4 key购买 nike

我已经在我们的实验室中建立了一个小型集群(9 个节点)用于计算。目前我正在使用一个节点作为 slurm Controller ,即它没有被用于计算。

我也想用它,但我不想分配所有的 CPU,我想保留 2 个 CPU 用于调度和其他与主节点相关的任务。

是否可以在 slurm.conf 中编写类似的内容:

NodeName=master NodeHostname=master  CPUs=10 RealMemory=192000 TmpDisk=200000 State=UNKNOWN
NodeName=node0[1-8] NodeHostname=node0[1-8] CPUs=12 RealMemory=192000 TmpDisk=200000 State=UNKNOWN
PartitionName=mycluster Nodes=node0[1-8],master Default=YES MaxTime=INFINITE State=UP

或者我破坏了什么?我不想在没有先询问的情况下测试它,因为集群已经在生产中,我担心会破坏某些东西......在上面的分区中,master 是我的 Controller 的主机名,node0[1-8] 是我的普通计算节点。如您所见,不使用 master 会损失集群 10% 的 CPU...

提前致谢

最佳答案

实际上是的,它有效。

我还添加了 Weight=1 到 nodes 和 Weight=2 到 master,这样它只在节点繁忙时使用。

干杯

关于configuration - slurm:也使用控制节点进行计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23497004/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com