关于机器学习中的核心技巧的直觉

rah*_*ulm 4 statistics machine-learning linear-algebra perceptron

我已成功实现了一个使用RBF内核的内核感知器分类器.我知道内核技巧将特征映射到更高的维度,因此可以构造线性超平面来分离点.例如,如果您有要素(x1,x2)并将其映射到三维特征空间,您可能会得到:K(x1,x2) = (x1^2, sqrt(x1)*x2, x2^2).

如果将其插入感知器决策函数w'x+b = 0,最终得到:w1'x1^2 + w2'sqrt(x1)*x2 + w3'x2^2这将为您提供循环决策边界.

虽然内核技巧本身非常直观,但我无法理解其中的线性代数方面.有人可以帮助我理解我们如何能够映射所有这些附加功能而无需使用内部产品明确指定它们吗?

谢谢!

Raf*_*ard 6

简单.

给出x和y的某些值的(x + y)^ 10的数值结果.

你更愿意做什么,"欺骗"和总和x + y,然后把这个值拿到第10个幂,或者扩展出写出来的确切结果

x^10+10 x^9 y+45 x^8 y^2+120 x^7 y^3+210 x^6 y^4+252 x^5 y^5+210 x^4 y^6+120 x^3 y^7+45 x^2 y^8+10 x y^9+y^10
Run Code Online (Sandbox Code Playgroud)

然后计算每个术语然后将它们一起添加?显然,我们可以在不明确形成10次多项式的情况下评估10次多项式之间的点积.

有效的内核是点积,我们可以"欺骗"并计算两点之间的数值结果,而不必形成明确的特征值.有许多这样的可能的内核,虽然只有少数已经在论文/实践中被大量使用.