我有一个带有双 Xeon E5-2650v4 cpu 的 Windows 文件服务器。它们各有 14 个核心,因此总共 28 个核心。
网络接口是 Mellanox Connectx3 40gbs。
服务器中的磁盘驱动器是 Raid 0 中的 7.68TB Sata 6gbps ssds x8(软件 Windows 条带)
有 200 个渲染节点从上述服务器读取数据以渲染 3D 帧。
文件服务器有一个 numa 节点或 cpu 使用率 100%,而第二个 cpu 利用率不高。
问题是,有些使用 3D 应用程序的用户在渲染过程中会遇到速度变慢的情况。当没有渲染时,从事项目的艺术家不会遇到任何减速情况。网络并未饱和,因为进出服务器的网络流量只有 5gbps。容量为40Gbps。
那么放缓的原因可能是什么?我怀疑的一件事是 Mellanox 网卡位于连接到 cpu2 的 PCI Express 插槽上,也许这就是 CPU 2 被 100% 使用的原因。每个渲染节点为了渲染而读取数千个小文件。因此,大量文件可能会导致 CPU 利用率较高。
有任何想法吗?