10 c optimization intrinsics
对于计算具有大量向量y_i的向量x的点积,我最好的选择是什么,其中x和y_i的长度大约是10k.
s/dgemv
我只是在这里寻找一般指导,所以任何建议都会有用. 是的,我确实需要表现.谢谢你的光.
小智 4
我认为 GPU 是专门为快速执行此类操作(以及其他操作)而设计的。因此,您可以利用 DirectX 或 OpenGL 库来执行矢量运算。D3DXVec2Dot这也将节省您的 CPU 时间。
归档时间:
16 年,8 月 前
查看次数:
2616 次
最近记录:
13 年,10 月 前