我有 2 个运行 RHEL 6.3 的服务器,它们有 2 个端口的 Infiniband 卡
>lspci | grep -i infini
07:00.0 InfiniBand: QLogic Corp. IBA7322 QDR InfiniBand HCA (rev 02)
Run Code Online (Sandbox Code Playgroud)
我有兴趣绕过Infiniband交换机(我没有)将它们直接相互连接。快速谷歌搜索表明,至少在某些配置中这是可能的。
我使用yum groupinstall "Infiniband Support"安装了所有 RedHat Infiniband 软件包。但是ibv_devinfo显示每张卡的两个端口都down了,说明没有连接网线。但是电缆已连接,尽管卡上的 LED 指示灯不亮(这不是一个好兆头)。另一个让我感到困惑的地方是,根据这个,RedHat 没有附带OFED软件包,由于缺乏 RedHat 对它们的支持,我有点犹豫要从源代码安装它们......那么我要去哪里呢? ? 我的问题是:
任何额外的输入/建议/指针将不胜感激。
PS我按照本指南获取安装说明。我的操作系统清楚地识别了 Infiniband 卡,并且 rdma 服务正在运行。
更新:我已经安装了 opensm。当我运行它时,它说:
OpenSM 3.3.13
Command Line Arguments:
Log File: /var/log/opensm.log
-------------------------------------------------
OpenSM 3.3.13
Entering DISCOVERING state
Using default GUID 0x1175000076e4c8
SM port is down
Run Code Online (Sandbox Code Playgroud)
并停留在那个点。
更新 2: 我无法让我的配置与 RedHat 软件包一起使用。openfabrics 的 OFED 包也不起作用。但是我找到了英特尔(今年早些时候收购了 QLogic)的官方驱动程序。有点,因为即使我让卡工作并相互交谈,重启后它们也永远不会回到 PORT_ACTIVE 状态。好吧,我可能会发布另一个关于它的问题。