如何确定 Infiniband 子网管理器在哪个交换机上运行?

ajd*_*con 14 networking infiniband

我最近继承了一个包含多个交换机的 Infiniband 网络,我知道其中一个交换机正在运行子网管理器。其余的应该关闭了该功能,或者从未启用过。问题是,我不知道是哪一个……

我想用在我的几个基础架构服务器上运行的 OpenSM 替换交换机子网管理器。除了单独登录每个交换机之外,有什么方法可以确定哪个交换机正在运行 SM?

小智 7

如果您的基础架构服务器可以运行 OpenSM,那么它们也可能安装了 OFED 堆栈实用程序。如果命令可用,ibstat将告诉您 SM 的 LID。然后使用LID中smpquery ND -L <LID>的获取运行SM的节点的节点描述。


Bru*_*ira 5

如果您的系统和软件包中安装了 OFED,您infiniband-diags可以使用命令sminfo列出 Infiniband 网络中正在运行的子网管理器:

~ # sminfo 
sminfo: sm lid 18 sm guid 0x0000000, activity count 55554951 priority 0 state 3 SMINFO_MASTER      
Run Code Online (Sandbox Code Playgroud)

它将列出该节点的所有已知子网管理器和主子网管理器。


小智 0

如果您通过 IP 地址联系经理,您可以查看交换机的 ARP/MAC 表来查找与您的交换机对应的 IP 地址。