rol*_*asi 4 machine-learning pca
我不明白 PCA 的一点。PCA 返回使每个特征的方差最大化的方向?我的意思是,它将为我们原始空间的每个特征返回一个组件,并且只有k最大的组件将用作新子空间的轴,对吗?所以实际上,如果我在 50-D 中并且 49 个特征具有很强的方差,我可以传递到 49-D 空间吗?当然,我说的是简单的英语,没有正式或技术性的内容。
谢谢
如果您的原始数据有 50 个维度,那么 PCA 将返回 50 个主成分。您可以选择k可以解释最大方差(通常至少为 90% 的方差)的主成分的子集。您使用的 PCA 软件通常会计算每个主成分解释了多少方差,因此只需将方差相加并选择k可以使您达到总方差 90%的顶部。请参阅此PCA 教程:
通常,我们希望选择最小的 K,以便解释总方差的 0.85 到 0.99(相当于 85% 到 95%),其中这些值遵循 PCA 最佳实践。
... 当我们说 PCA 可以降低维数时,我们的意思是 PCA 可以计算主成分并且用户可以选择其中解释 0.95 方差的最小数量 K。主观上令人满意的结果是当 K 相对于原始特征数 D 较小时。