PCA中第一组分所涵盖的99%方差的显着性

noo*_*333 2 matlab pca

当第一个组件覆盖超过PCA分析总方差的99%时,它意味着什么/意味着什么?我有一个大小为500X1000的特征向量,我使用Matlab的pca函数返回[coeff,score,latent,tsquared,explain].变量'explain'返回每个组件所涵盖的方差百分比.

And*_*uri 7

explained告诉您只需使用该主要组件即可准确表示数据.在您的情况下,这意味着只使用主要主成分,您可以非常准确地描述(达到99%)数据.

让我们做一个2D示例.想象一下,你有数据,100x2你做PCA.

结果可能是这样的(取自互联网)

在此输入图像描述

此数据将为您提供explained约90%的第一个主成分(图中的PCA第一维绿色大箭头)的值.

这是什么意思?

这意味着如果将所有数据投影到该行,您将以90%的精度重建点(当然,您将丢失PCA第二维方向上的信息).

在你的例子中,99%的视觉上意味着蓝色的几乎所有点都放在大绿色箭头上,绿色小箭头方向的变化非常小.

当然,使用1000维度而不是2维度进行可视化更加困难,但我希望您理解.

  • @ user1791066不知道!这是一个全新的问题.它很奇怪,因为它不应该发生.你是如何计算新的500x1值的?无论如何,更好地打开一个更详细的问题. (2认同)