ale*_*cco 6 sorting assembly simd
给定4个字节的寄存器(或SIMD的16个寄存器),必须有一种有效的方法来使用一些指令对寄存器中的字节进行排序.
提前致谢.
找到了!这是2007年的论文"使用SIMD寄存器和指令在分类算法中实现指令级并行",由Furtak,Amaral和Niewiadomski撰写.第4节.
它使用4个SSE寄存器,有12个步骤,并运行19个指令,包括加载和存储.
同一篇论文在动态制作带有SIMD的分拣网络方面有一些很好的工作.
| 归档时间: |
|
| 查看次数: |
1877 次 |
| 最近记录: |