gpt4 book ai didi

Slurm 设置 : Error connecting slurm stream socket

转载 作者:行者123 更新时间:2023-12-05 04:02:19 26 4
gpt4 key购买 nike

我正在尝试使用 slurm 设置一个新集群。我已经设置了一个客户端和一个控制机器。 (我是新手......)

  1. 当我在控制机器上输入sinfo -vvv时,它告诉我

"sinfo: debug2: slurm_connect failed: Connection refused sinfo:debug2:在 192.168.155.142:6817 连接 slurm 流套接字时出错:连接被拒绝“

我的 slurm 配置为使用 6817 端口(完整配置可在此处获得 https://pastebin.com/X4yDe99z

SlurmctldPort=6817

端口已打开(我也尝试禁用 ufw)

6817 (v6) ALLOW Anywhere (v6)

  1. 当我尝试 slurmctld -Dvvv 时显示此错误

slurmctld:错误:此主机 (xxxx/xxx) 不是有效的 Controller (gaia 或(null))

我的/etc/hosts 文件是
127.0.0.1 本地主机
192.168.155.142 盖亚

最佳答案

slurm.conf 中参数ControlMachine 的值,启动slurmctld 的机器,必须是hostname -s 在该机器上启动守护程序。

您机器上的 hostname -s 似乎没有输出 gaia。将 gaia 替换为隐藏在 xxxx/xxx 后面的内容。

关于Slurm 设置 : Error connecting slurm stream socket,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54429016/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com