我有一个功能:
void Func(const int * a, const int * b, size_t size, int p, int * c)
{
for (size_t i = 0; i < size; ++i)
c[i] = (a[i]*b[i])%p;
}
Run Code Online (Sandbox Code Playgroud)
此函数对整数数组执行许多模乘.所有整数都是正数.我需要提高其性能.
我想到了SSE和AVX.但它们没有向量化乘法的矢量化操作.或许我错了?
也许有人知道解决这个问题的任何可能性吗?