机器学习中维度,属性和特征的区别

Hig*_*ler 9 machine-learning

这是二维的:[[2,2]]但它也有2个特征/属性不是它.我对尺寸,属性和特征之间的区别感到困惑.

lej*_*lot 28

我不同意@Atilla的回答

  • 维度通常是指属性的数量,虽然它也可以以"数据向量的第二维度是人的年龄"的形式使用,但它相当罕见 - 在大多数情况下,维度是"属性的数量"
  • 属性是您的点中一种特殊的"数据类型",因此每个观察/数据点(如个人记录)包含许多不同的属性(如人的体重,身高,年龄等)
  • 根据上下文,功能可能有多种含义:
    • 它有时指的是属性
    • 它有时指的是通过特定的学习模型生成的数据的内部表示,例如-神经网络提取特征它们的属性或其它特征的组合
    • 它有时指的是由内核方法引起的数据的假设表示(在内核PCA,内核k-means,SVM中)

通常你有一些对象X,您描述了使用某些属性(它是第一步骤的特征提取,并且因此这些属性也有时refered为特征),这产生给定的表示尺寸(数量的属性,提取的特征).然后,你训练的一些模型,这往往造成某种抽象的(有时甚至是多级),并且每个这样的抽象产生新的特征(从特征提取功能),这是更复杂的对象,然后在较低"级别"的人.

 X  --->   repr(X)   --->   f1(repr(X)) --->   ....  --->   fn(repr(X))
data      attributes         1st level                      nth level
        (0th features)       features                       features

      |repr(X)|=dimension
Run Code Online (Sandbox Code Playgroud)

f经常是经常性的,所以f2(repr(X))实际上是一些f2'(f1(repr(X))