比较Intel Xeon Phi和Nvidia Tesla K20的基准

Question

令我惊讶的是,我无法使用开源OpenCL基准测试套件(例如rodinia和SHOC)找到这些产品的比较.这种比较可能比理论峰值性能或简单矩阵乘法内核中的性能比较更有趣,我已经能够找到它.

有谁知道这些结果可能在哪里？如果不这样做,任何堆栈溢出用户是否可以访问一个或两个产品,以及运行基准测试并分享结果的时间和倾向？任何一种卡版本的结果都会很有趣.

Answer 1

CLBenchmark.com现在有一些Xeon Phi的结果,以及K20c的完整设置.

Answer 2

这是Xeon Phi与GTX Titan的比较.

Xeon Phi基本上在10/12基准测试中完全被破坏,并且与其他2基准测试完全相同.因此300瓦22 nm Phi部分与250瓦28 nm GPU相差无几.

基本上,Phi似乎在利用它的带宽容量方面遇到了重大麻烦,矢量化代码似乎是另一个问题.

Answer 3

以下是比较稀疏矩阵乘法性能的基准：

它部分回答了我的问题，但我宁愿看到不止一种算法，并且我想了解 OpenCL 性能的可移植性，我仍然会接受任何可以提供该信息的答案。

比较Intel Xeon Phi和N​​vidia Tesla K20的基准