在C/C++中是否存在极其优化的memcpy2d?

exe*_*ook 3 c c++ assembly 2d intel

我正在寻找能够使用SSD/MMX/3DNow/SIMD(Whatever)将2D阵列快速复制到另一个(更大的)2D阵列的东西.我不想实现自己,只是寻找一个高度优化的支持和维护解决方案.我在Linux上使用Clang(++).

memcyp2Di(int *src, int *dest, int srcw, int srch, int destw, int desth, int destx, int desty)
Run Code Online (Sandbox Code Playgroud)

小智 5

通过Agner Fog 查看Asmlib,它提供了一个极其优化的memcpy版本和其他常见的libc函数,这些函数是用汇编编写的,并使用CPU中可用的最佳SIMD指令集,从基本的SSE一直到最新的AVX2和FMA3例如,Haswell处理器中的说明.