gpt4 book ai didi

SLURM 根据 GRES 自动限制内存/CPU 使用

转载 作者:行者123 更新时间:2023-12-04 04:21:17 27 4
gpt4 key购买 nike

鉴于单个节点有多个 GPU,是否有一种方法可以根据请求的 GPU 数量自动限制 CPU 和内存使用量?

特别是,如果用户作业脚本请求 2 个 GPU,则作业应自动限制为 2*BaseMEM2*BaseCPU,其中 BaseMEM = TotalMEM/numGPUsBaseCPU=numCPUs/numGPUs,它们将在每个节点的基础上定义。

可以这样配置 SLURM 吗?如果不是,是否可以选择将多 GPU 机器“虚拟”拆分为具有适当 CPU 和 MEM 数量的多个节点?

最佳答案

在命令行上

--cpus-per-gpu $BaseCPU --mem-per-gpu $BaseMEM

在 slurm.conf 中

DefMemPerGPU=1234
DefCpuPerGPU=1

由于您不能在 slurm.conf 中使用变量,因此您需要编写一些 bash 命令来计算 $BaseCPU 和 $BaseMEM

关于SLURM 根据 GRES 自动限制内存/CPU 使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59250846/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com