ajd*_*con 14 networking infiniband
我最近继承了一个包含多个交换机的 Infiniband 网络,我知道其中一个交换机正在运行子网管理器。其余的应该关闭了该功能,或者从未启用过。问题是,我不知道是哪一个……
我想用在我的几个基础架构服务器上运行的 OpenSM 替换交换机子网管理器。除了单独登录每个交换机之外,有什么方法可以确定哪个交换机正在运行 SM?
小智 7
如果您的基础架构服务器可以运行 OpenSM,那么它们也可能安装了 OFED 堆栈实用程序。如果命令可用,ibstat
将告诉您 SM 的 LID。然后使用LID中smpquery ND -L <LID>
的获取运行SM的节点的节点描述。
如果您的系统和软件包中安装了 OFED,您infiniband-diags
可以使用命令sminfo列出 Infiniband 网络中正在运行的子网管理器:
~ # sminfo
sminfo: sm lid 18 sm guid 0x0000000, activity count 55554951 priority 0 state 3 SMINFO_MASTER
Run Code Online (Sandbox Code Playgroud)
它将列出该节点的所有已知子网管理器和主子网管理器。