PCA的意思是仅保留大的成对距离?

Bak*_*war 3 python visualization machine-learning matplotlib pca

我目前正在阅读t-SNE可视化技术,并且提到使用PCA可视化高维数据的一个缺点是它只保留 了点之间的大的成对距离.在高维度上相距很远的意义点在低维度上也会显得相距甚远,但除了所有其他点距离被搞砸之外.

有人可以帮助我理解为什么这是什么,它是什么意思图形化?

非常感谢!

Don*_*eba 6

不要将PCA与降维相混淆.

PCA是一种旋转变换,它使数据与轴对齐,使得第一维具有最大方差,其余为第二维最大方差等.旋转保持成对距离.

使用PCA进行降维时,可以丢弃具有最小方差的旋转数据的尺寸.当点远离平均值时,实现高方差.低方差维度是那些值大多相同的维度,因此假定它们的缺失对成对距离的影响最小.

  • @Manish,这仅意味着在PCA之后通过丢弃低方差尺寸而使成对距离略微失真可能会导致丢失小的差异。 (2认同)