在 HPC 集群中使用 i7 "gamer" cpu

use*_*721 6 central-processing-unit xeon hpc

我正在运行 WRF 天气模型。这是一个内存密集型、高度并行的应用程序。

我需要为此构建一个 HPC 集群。我使用 10GB infiniband 互连。

WRF 不取决于核心数,而是取决于内存带宽。这就是酷睿 i7 3820 或 3930K 的性能优于高级至强 E5-2600 或 E7 的原因

似乎大学将至强 E5-2670 用于 WRF。它的成本约为1500美元。Spec2006 fp_rates WRF bench 显示 580 美元的 i7 3930K 与 1600MHz RAM 的性能相同。

有趣的是,i7 可以处理高达 2400MHz 的 ram,为 WRF 做了很大的性能提升。然后它真的胜过至强。耗电量稍高,但仍低于每年 20 欧元。即使包括我需要的额外部件(PSU、infiniband、外壳),i7 方式仍然比 Xeon 便宜 700 €/cpu。

那么,可以在 HPC 集群中使用“游戏玩家”硬件吗?还是我应该用至强做专业?

(这不是关键应用程序。我可以处理停机时间。我想我不需要 ECC?)

eww*_*ite 10

我们在高频金融交易领域做过一段时间(考虑到我正在使用的应用程序架构,与 HPC 非常相似)......

大约在 2010 年初,我部署到带有10GbE Solarflare(带有OpenOnload UDP 消息内核旁路)和/或 Infiniband 互连的定制 3U 机架式单插槽 i7“游戏系统” 。

我没有 IPMI/带外管理、电源管理、单一电源和热插拔部件。我们在不同点同时使用 SSD 和内部 SAS 磁盘,但磁盘对计算节点并不重要。操作系统是 Fedora Linux,具有高度定制和调整的内核。

这在概念验证中起作用,并且在我们了解我们的交易应用程序将如何在生产中对实时数据做出反应之前一直保持不变。然而,随着事情的发展,这变成了管理的噩梦……

诸如冷却、数据中心热量/空间/密度(这些是 3U 机箱)、支持和远程管理等问题最终使这项工作付诸东流。虽然 CPU 在技术上从未出现故障,但其他所有组件都有问题!. 而这只是一个 8 小时的日常生产使用周期......

我们长期做了什么?

我们放弃了游戏玩家 PC,转而使用适当的专用服务器硬件。是的,这是一家金融公司,所以我们没有预算限制,但考虑到未经证实的应用程序的潜在规模,我仍然需要注意定价。所有价格范围内都有不错的服务器,如果您打算扩大规模,可以与制造商达成交易。您认为大型 HPC 研究实验室集群不会为设备支付零售价,对吗?我们也没有...

因此,如果您想这样做,请考虑大局。如果您只是考虑在其他服务器级硬件中使用台式机级 CPU,它会起作用……但我不建议全职使用它。

如果您知道 CPU 限制和可用性问题,那么我只能提供一个数据点供考虑。


MDM*_*rra 6

i7 不能使用 ECC 缓冲 RAM,也不能安装在双插槽或四插槽配置中。这似乎是不使用它的充分理由 - 但当然,您的需求可能另有规定。