机器学习中的参数,特征和类之间的差异

Jay*_*tel 18 terminology machine-learning

我是机器学习和自然语言处理的新手.

我总是在这三个术语之间感到困惑?

根据我的理解:

class:我们的模型输出的各种类别.鉴于人的姓名,确定他/她是男性还是女性?

让我们说我正在使用朴素贝叶斯分类器.

我的功能和参数是什么?

此外,上述单词的一些别名可以互换使用.

谢谢

txi*_*zle 18

让我们使用分类一个人的性别的例子.你对课程的理解是正确的!给定输入观察,我们的朴素贝叶斯分类器应该输出一个类别.该类是该类别.

特征:朴素贝叶斯分类器中的特征,或任何通用的ML分类算法,是我们选择定义输入的数据点.对于一个人的例子,我们不可能输入关于一个人的所有数据点; 相反,我们选择一些功能来定义一个人(比如"高度","重量"和"脚尺寸").具体来说,在Naive Bayes分类器中,我们做出的关键假设是这些特征是独立的(它们不会相互影响):一个人的身高不影响体重并不影响足部尺寸.这个假设可能或不合适,但对于Naive Bayes,我们假设它是真的.在您的示例的特定情况下,输入只是名称,功能可能是字母的频率,元音的数量,名称的长度或后缀/前缀.

参数:Naive Bayes中的参数是我们尝试分类的任何内容的真实分布的估计.例如,我们可以说大约50%的人是男性,男性身高的分布是高斯分布,平均值为5'7",标准差为3".参数将是50%估计值,5'7"平均估计值和3"标准差估计值.

别名:功能也称为属性.我不知道'参数'的任何常见替代品.

我希望这有用!


pin*_*cir 13

@txizzle很好地解释了朴素贝叶斯的案例.在更一般的意义上:

类:数据的输出类别.您也可以调用这些类别.您的数据上的标签将指向其中一个类(当然,如果它是分类问题.)

功能:定义问题的特征.这些也称为属性.

参数:算法试图调整的变量,以构建精确的模型.

举个例子,让我们假设您正在尝试根据他/她的本科GPA,考试成绩,推荐分数,项目等各种因素来决定是否允许学生进入加德学校.在这种情况下,提到的因素以上是您的功能/属性,无论学生是否被录取成为您的2个班级,以及决定这些功能如何组合在一起以使您的输出成为您的参数的数字.参数实际代表什么取决于您的算法.对于神经网络,它是突触链接上的权重.同样,对于回归问题,参数是组合时要素的系数.


Arp*_*dia 5

提出一个简单的线性分类问题

y = {0,如果5x-3> = 0,否则为1}

这里y是类,x是特征,5,3是参数。

  • 伟大而被低估的答案!答案还应该根据其简短程度进行评级。这个用最少的字符传达了最有用的信息。 (2认同)