小编cib*_*lip的帖子

ARM/NEON的64位/ 32位分区更快算法?

我正在研究一个代码,其中两个地方有64位乘32位定点除法,结果取32位.这两个地方共占用了我总时间的20%以上.所以我觉得如果我能删除64位除法,我可以很好地优化代码.在NEON中,我们可以有一些64位指令.任何人都可以建议通过使用更快的实现来解决瓶颈问题.

或者如果我可以用C中的32位/ 32位除法进行64位/ 32位除法,那也没关系?

如果有人有任何想法,你能帮帮我吗?

c arm

7
推荐指数
1
解决办法
3386
查看次数

标签 统计

arm ×1

c ×1