我在网上遇到过很多类似的问题,但找不到解决我能理解的问题的问题.我将在此感谢一些解释,以帮助我理解.提前致谢!
所以,
[COEFF,SCORE,latent,tsquare] = princomp(X)
Run Code Online (Sandbox Code Playgroud)
据我所知,coeff列是按组件差异递减的顺序排列的.但我是否知道我的变量(原始数据集)的重要性,而不是主要组件(PC)的重要性,因为coeff可能存在的答案.有没有办法对我所拥有的变量的重要性进行排序?
我看到许多统计软件能够做到这一点,显示哪些原始变量对绘图贡献最大,哪些是可以删除以防止过度拟合问题.有没有办法用MatLab做到这一点?
我的目标是在2D图中绘制数据,这意味着我将使用PC1和PC2,它们具有最重要的组件差异.那么,我怎么知道应该保留哪些变量以及哪些变量应该被丢弃?
任何人都可以向我解释这个吗?谢谢!
如果您只关心将数据投影到 2D 平面以进行可视化,那么请务必获取每个点的前两个坐标- 这些是您在问题中SCORE提到的坐标。PC1PC2
但是,如果您想知道谁贡献最大的两个组成部分XPC1,则PC2必须在前两列中找到COEFF具有最大绝对值的条目。由于 的前两列COEFF代表 中元素的线性组合,从而X产生PC1和PC2。