快速注册时的字节数?

ale*_*cco 6 sorting assembly simd

给定4个字节的寄存器(或SIMD的16个寄存器),必须有一种有效的方法来使用一些指令对寄存器中的字节进行排序.

提前致谢.

ale*_*cco 7

找到了!这是2007年的论文"使用SIMD寄存器和指令在分类算法中实现指令级并行",由Furtak,Amaral和Niewiadomski撰写.第4节.

它使用4个SSE寄存器,有12个步骤,并运行19个指令,包括加载和存储.

同一篇论文在动态制作带有SIMD的分拣网络方面有一些很好的工作.


Dar*_*con 5

查找有效的排序网络,N =您关心的字节数(4或16).将其转换为比较和交换指令序列.(但是,对于N = 16,这将超过'少数'.)