Fah*_*eem 26 math machine-learning linear-algebra
我真的无法理解下面的等式,尤其是1/(2m).
这个等式的目的是什么?哪里1/(2m)来了?
J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2
Run Code Online (Sandbox Code Playgroud)
请解释.如何施展???
lej*_*lot 79
成本函数是
J(theta_0, theta_1) = 1/(2m) * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2
Run Code Online (Sandbox Code Playgroud)
通过h_theta(x^i)我们表示什么模型输出x^i,h_theta(x^i) - y^i它的错误也是如此(假设,这y^i是一个正确的输出).
现在,我们计算这个错误的平方[ h_theta(x^i) - y^i ]^2(除去符号,因为这个错误可能是正面的和负面的)并在所有样本上求和,并以某种方式约束它我们将它标准化 - 只需要除以m,所以我们有意思(因为我们按样本数量排除)平方(因为我们平方)错误(因为我们计算错误):
1/m * sum_(i=1)^m [ h_theta(x^i) - y^i ]^2
Run Code Online (Sandbox Code Playgroud)
这2将显示在前面使用仅用于衍生的简化,因为当你将尽量减少它,你会用最速下降法,它是基于这个函数的导数.衍生的a^2是2a,而我们的函数是一个正方形的东西,所以这2将取消.这是它存在的唯一原因.