Koj*_*ara 8 algorithm machine-learning image-processing face-detection adaboost
在描述Viola-Jones物体检测框架(Viola和Jones的Robust Real-Time Face Detection)的论文中,有人说:
用于训练的所有示例子窗口都是归一化的方差,以最小化不同照明条件的影响.
我的问题是 "他们使用什么样的工具来标准化图像?"
我不是在寻找Viola&Jones使用的特定工具,而是一个产生几乎相同输出的类似工具.我一直在关注很多haar-training教程(试图检测一只手),但还不能输出一个好的探测器(xml).
我试过联系作者,但还没有回复.
一种可能的方法是应用简单和简单的归一化,假设正态分布到所有元素.
首先找到平均值(Mu)和标准差(S):
Mu = 1/N * Sum(a[i][j]) for each i,j
S = sqrt(1/(N-1) * Sum((a[i][j] - Mu)^2)) for each i,j
(in here N is the number of pixels, 20*20 in the viola jones case)
Run Code Online (Sandbox Code Playgroud)
由此,我们可以使用标准正态分布公式(通过标准化所有值)来标准化每个像素的值:
a'[i][j] = (a[i][j] - Mu) / S
Run Code Online (Sandbox Code Playgroud)
另一种方法是矢量归一化,基本上说:
|a| = sqrt(sum (a[i][j]*a[i][j])) for each i,ja'[i][j] = a[i][j] / |a|