Ope*_*way 5 c simd
我需要在Cell处理器的SPE上使用SIMD扩展来优化一些C代码,这些代码可以进行大量的物理计算.每个向量运算符可以同时处理4个浮点数.理想情况下,我希望在最乐观的情况下加速4倍.
你认为使用向量运算符可以提供更大的加速吗?
谢谢
wal*_*lyk 4
最好的优化发生在重新思考算法时。消除不必要的步骤。找到更多实现相同结果的直接方法。在与问题更相关的领域中计算解决方案。
例如,如果向量数组是n个都在同一行上的列表,那么仅变换端点并插值中间点就足够了。
归档时间:
15 年,2 月 前
查看次数:
676 次
最近记录: