通过PCA进行特征提取

Mor*_*o88 3 statistics matlab artificial-intelligence machine-learning pca

我正在尝试从包含2000个样本的数据中为63个样本选择一个特征子集.现在我知道如何在MATLAB中做PCA.我使用'pcacov',它也返回特征向量和特征值.但是,我不知道如何选择我想要的功能.我的意思是如果功能没有标注,我该如何选择我的功能?或者他们会以同样的顺序归还?

Don*_*eba 8

PCA不会告诉您哪些功能最重要,但哪些功能组合保持最大差异.

PCA所做的是以一种方式旋转数据集,使其沿第一维度具有最大的方差,沿第二维度具有最大的方差,依此类推.因此,当您通过前N个特征向量乘以特征向量时,您要做的是旋转集合并保留前N个维度以将向量转换为保持大部分方差的低维表示.