监督学习,无监督学习,回归

wuc*_*ang 2 machine-learning linear-regression logistic-regression

我知道:

  1. 无监督学习是试图在未标记数据中找到隐藏结构 ,否则,我们称之为监督学习.
  2. 回归也是一种分类,除了它的输出是无限数量的数字.
  3. 我也知道分类是一种监督学习.

但令我困惑的是:

  1. 线性回归(line fitting)是一种回归?如果是这样,为什么它的数据没有标记?例如,它的样本数据只是一些坐标,如(1,2),(2,3),(1,4)?
  2. 逻辑回归(分类)是一种回归?如果是这样,为什么它的输出只是正常的(值,真,假,0或1)?

任何人都可以帮我解决这个问题?

小智 11

1)线性回归受到监督,因为您拥有的数据包括输入和输出(也就是说).因此,例如,如果您有经销商处的汽车销售数据集.对于每辆车,您拥有品牌,型号,价格,颜色,折扣等,但您拥有每辆车的销售数量.如果这个任务没有受到监督,你可能会有一个数据集,其中可能只包括品牌,型号,价格,颜色等(而不是实际的销售数量),你可以做的最好就是对数据进行集群.这个例子并不完美,但旨在了解全局.在决定某种方法是否受到监督时要问自己一个很好的问题就是问"我有办法判断输入的质量吗?".如果你有线性回归数据,你肯定可以.您只需评估输入数据的函数值(在本例中为线)来估算输出.在另一种情况下则不是这样.

2)Logistic回归实际上不是回归.该名称具有误导性,确实导致了很多混乱.它通常仅用于二进制预测,这使得它非常适合分类任务,但没有别的.

  • @valentin,你所说的是正确的,但仅在“统计回归”中,但是当我们谈论“监督学习中的回归”时,它与答案不同。参考这个:https://chemicalstatistician.wordpress.com/2014/01/05/machine-learning-lesson-of-the-day-classification-and-regression/ (2认同)

Nei*_*gan 5

线性回归受到监督。您从具有已知因变量(标签)的数据集开始,训练模型,然后应用它。您正在尝试预测一个真实的数字,例如房屋的价格。

逻辑回归也受到监督。尽管它的名字如此,但它更像是一种分类器而不是回归技术。您正在尝试预测班级成员的几率比,例如某人死亡的几率。

无监督学习的例子包括聚类和关联分析。