感知器重量更新规则的直觉

jos*_*nes 11 algorithm machine-learning perceptron

我无法理解感知器的重量更新规则:

w(t + 1)= w(t)+ y(t)x(t).

假设我们有一个线性可分的数据集.

w是一组权重[w0,w1,w2,...],其中w0是偏差.
x是一组输入参数[x0,x1,x2,...],其中x0固定为1以适应偏差.

在迭代t,其中t = 0,1,2,...,

w(t)是迭代t的权重集.
x(t)是错误分类的训练示例.
y(t)是x(t)的目标输出(-1或1).

为什么此更新规则会在正确的方向上移动边界？

感知器的输出是实例和重量之间的点积的硬限制.让我们看看更新后这种情况如何变化.以来

w(t + 1)= w(t)+ y(t)x(t),

然后

x(t)·w(t + 1)= x(t)·w(t)+ x(t)·(y(t)x(t))= x(t)·w(t)+ y( t)[x(t)·x(t))].

注意:

根据算法的规范,仅在x(t)被错误分类时才应用更新.
通过点积的定义,x(t)·x(t)≥0.

这如何相对于x(t)移动边界？

如果x(t)被正确分类,则算法不应用更新规则,因此没有任何变化.
如果x(t)被错误地归类为负数,则y(t)= 1.由此得出新的点积增加x(t)·x(t)(其为正).因此,就x(t)而言,边界向右移动.
相反,如果x(t)被错误地归类为正,则y(t)= -1.由此得出新的点积减少x(t)·x(t)(其为正).因此,就x(t)而言,边界向右移动.

归档时间：	9 年，10 月前
查看次数：	7663 次
最近记录：	7 年前

scikit-learn 和 tensorflow 有什么区别？可以一起使用吗？ 32

模糊匹配重复数据删除小于指数时间？ 17

线程推文有什么好的启发式方法？ 14

确定数组中最常见的事件 10

针对特定情况的最快排序算法 8

通过添加元素来减少数组 7

在 Tensorflow 中使用镜像策略时出错 7

计算机视觉:提取有关给定轮廓的形状的信息(例如,尖,圆...) 6

从'三角汤'中找到独特的顶点 6

XGBoost CV 和最佳迭代 6

C++中的" - >"运算符是什么？ 8590

迭代HashMap 3244

jQuery是否存在"存在"功能？ 2669

以像素为单位获取屏幕尺寸 1798

为什么在C++中读取stdin的行比Python要慢得多？ 1738

为什么++ [[]] [+ []] + [+ []]返回字符串"10"？ 1613

是否有快速Git命令来查看旧版本的文件？ 1438

如何查看Git提交中的更改？ 1364

如何使用Sublime Text 2重新格式化HTML代码？ 1282

如何在Python中打印到stderr？ 1246