gpt4 book ai didi

linux - Rdma infiniband 无法打开主机(iberror : discovery failed) Port state: Down

转载 作者:行者123 更新时间:2023-12-04 19:24:13 29 4
gpt4 key购买 nike

在我的两个节点上配置 rdma 和 Infiniband 时遇到问题。这两个节点都已连接,并且我已经安装了推荐的所需软件库和软件包。
但我的端口状态为关闭,物理状态为禁用。我尝试启用状态,但出现无法打开 MAD PORT 的错误

:~# ibportstate -L 1 3 enable


ibwarn: [6772] mad_rpc_open_port: can't open UMAD port ((null):0)ibportstate: iberror: failed: Failed to open '(null)' port '0'


Infiniband ibstatus 返回:
Infiniband device ‘mlx5_0’ port 1 status:
default gid: fe80:0000:0000:0000:1270:fdff:fe6e:43e0
base lid: 0x0
sm lid: 0x0
state: 1: DOWN
phys state: 3: Disabled
rate: 100 Gb/sec (4X EDR)
link_layer: Ethernet
我不明白这里似乎是什么问题,我也升级了固件,但问题仍然存在。

最佳答案

我想通了,我正在分享答案供其他人查看,所以问题是网络接口(interface),您需要查看 Infiniband 哪个网络接口(interface)并检查状态。

root@dtn0:~# /etc/init.d/openibd status

 HCA driver loaded

Configured Mellanox EN devices:
ens11np0

Currently active Mellanox devices:


The following OFED modules are loaded:

rdma_ucm
rdma_cm
ib_ipoib
mlx5_core
mlx5_ib
ib_uverbs
ib_umad
ib_cm
ib_core
mlxfw
之后,我只是在接口(interface)上分配了 Ip 和网络掩码,我就可以使用该接口(interface)并访问网络。

root@dtn0:~# ifconfig ens11np0 10.0.0.50/24

关于linux - Rdma infiniband 无法打开主机(iberror : discovery failed) Port state: Down,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72637236/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com