我在CUDA上工作了很多,并且在CPU上做了很多工作,我正在努力理解两者之间的区别.我的I5处理器有4个内核,售价200美元,我的NVidia 660有960个内核,成本差不多.
如果有人能够解释两种处理单元架构在能力优劣方面的主要区别,我会非常高兴.例如,CUDA核心是否有分支预测?
cpu cuda
cpu ×1
cuda ×1