gpt4 book ai didi

slurm - 并行但不同的 Slurm srun 作业步骤调用不起作用

转载 作者:行者123 更新时间:2023-12-03 16:06:20 32 4
gpt4 key购买 nike

我想在大量不同的输入文件上运行相同的程序。我可以将每个作为单独的 Slurm 提交提交,但我不想通过一次在队列上倾倒 1000 个作业来淹没队列。我一直在试图弄清楚如何通过先创建分配来处理相同数量的文件,然后在该分配中使用 srun 循环遍历所有文件,从分配中为每个调用提供一个核心。问题是无论我做什么,一次都只运行一个作业步骤。我能想到的最简单的测试用例是:

#!/usr/bin/env bash

srun --exclusive --ntasks 1 -c 1 sleep 1 &
srun --exclusive --ntasks 1 -c 1 sleep 1 &
srun --exclusive --ntasks 1 -c 1 sleep 1 &
srun --exclusive --ntasks 1 -c 1 sleep 1 &

wait

我分配多少核并不重要:
time salloc -n 1 test
time salloc -n 2 test
time salloc -n 4 test

它总是需要 4 秒。是否不可能并行执行多个作业步骤?

最佳答案

请注意,在这种情况下,您将同时测量运行时间和等待时间。您的提交脚本应如下所示:

#!/usr/bin/env bash

time {
srun --exclusive --ntasks 1 -c 1 sleep 1 &
srun --exclusive --ntasks 1 -c 1 sleep 1 &
srun --exclusive --ntasks 1 -c 1 sleep 1 &
srun --exclusive --ntasks 1 -c 1 sleep 1 &
wait
}

并简单地提交
salloc -n 1 test
salloc -n 2 test
salloc -n 4 test

然后,您应该观察差异以及诸如 srun: Job step creation temporarily disabled, retrying 之类的消息。使用时 n<4 .

关于slurm - 并行但不同的 Slurm srun 作业步骤调用不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35498763/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com