我最近发现我的程序花费大部分时间在以下简单函数中:
void SumOfSquaredDifference(
const uint8_t * a, size_t aStride, const uint8_t * b, size_t bStride,
size_t width, size_t height, uint64_t * sum)
{
*sum = 0;
for(size_t row = 0; row < height; ++row)
{
int rowSum = 0;
for(size_t col = 0; col < width; ++col)
{
int d = a[col] - b[col];
rowSum += d*d;
}
*sum += rowSum;
a += aStride;
b += bStride;
}
}
Run Code Online (Sandbox Code Playgroud)
此函数查找两个8位灰度图像的平方差之和.我认为使用SSE可以改善其性能,但我没有这方面的经验.有人能帮助我吗?