我正在构建一个工作站,并希望进入一些繁重的CUDA编程.我不想全力以赴获得特斯拉卡,并且几乎将其缩小到Quadro 4000和GeForce 480,但我真的不明白它的区别,在纸面上它看起来480有更多的核心对于4000而言,480比256,但是4000的价格几乎是480的两倍.有人理解这里的差异来证明更高的价格.
我将对它进行科学计算,因此如果它们在它们之间产生差异,那么一切都将是双精度的.
psz*_*ard 36
如果您既不关心可视化也不关心渲染(在屏幕上绘制最终结果,例如光线追踪),那么问题的答案会稍微简单一些,但不是微不足道的.
我不打算详细介绍Quadro和GeForce卡之间的差异,但我会强调可以在它们之间进行选择的重点.
如果你需要大量内存而不是需要特斯拉或Quadro.消费卡ATM最大1.5 Gb(GTX 480),而Teslas和Quadros最大6 Gb.
GF10x系列卡的双精度(FP64)性能上限为单精度(FP32)性能的1/8,而架构则为1/2.另一个市场细分技巧,现在在硬件制造商中非常流行.使GeForce系列瘫痪的目的是让Tesla系列产品在HPC中占据优势; GTX 480实际上比特斯拉20x0更快 - 1.34TFlops对1.03 TFlops,177.4 Gb对144 Gb/sec(峰值).
特斯拉和Quadro(应该是)经过了更彻底的测试,因此不太容易产生与游戏无关的错误,但是当涉及到科学计算时,只需一次翻转就会破坏结果.NVIDIA声称特斯拉卡是QC-d,可全天候使用.
最近的一篇论文(Haque和Pande,关于软错误的硬数据:GPGPU中实际错误率的大规模评估)表明,特斯拉确实不易出错.
我的经验是,GeForce显卡的可靠性往往较低,特别是在高负荷下.适当的散热非常重要,同时避免使用超频卡(包括工厂过度使用的型号)(参见前面提到的论文的图1 ).
用于生产HPC /科学计算:
Quadro如果需要FP64和/或还需要高级渲染功能(新的"Fermi"Teslas具有与GeForce类似的渲染功能)
如果你想密集使用FP64,请忘记GeForce
你提到的两张牌来自完全不同的联赛,因此不能直接比较.如果您需要 Quadro的渲染功能,请购买Quadro.否则,Quadro并不值得,特别是4000不比GTX 460慢,而且价格要高出3.5倍.我认为你最好使用GTX 470或480,只需确保购买标准频率的产品.
请注意,在这种比较中,瘫痪的GeForce双精度性能不是问题,但让我详细说明.由于Quadro 4000是一款低端型号,AFAIR只有450 MHz着色器(我找不到参考ATM,但它应该绝对低于5000的时钟频率为513 MHz),这使它大约有115个GFlops FP64.与此同时,上限GTX 480约为168 GFlops FP64,甚至GTX 460约为113 GFlops(峰值).Quadro 4000与GTX 480相比
,FP32性能和内存带宽都要低得多(86.9 vs 177.4 GB/s)!
请注意,从理论峰值性能的角度来看,GTX 480(数据表)比Tesla C2050/2070和Quadro 6000快得多,这在大多数应用中得到了体现.
上面没有提到的Quadro/Tesla卡有一些小优点:
当然,这些优点对大多数人来说没有任何区别.但是,对于某些用途,它们至关重要.