通常一些data.frame包含20多个变量,并且您希望获得第一个概述(相关结构).即使在一个30英寸的屏幕上,你也会迅速跑出太空而且仍然很难掌握这个信息.是否有任何既定的策略来突出重要的事情?我知道这个问题有点笼统,但我一遍又一遍地想,从来没有过治愈它的灵丹妙药.我听说过summary.
Sac*_*amp 16
好吧,我只需要在这里张贴我自己的包:)
您可以使用qgraph将相关矩阵可视化为网络.这将把变量绘制为节点,将相关性绘制为连接节点的边.绿色边缘表示正相关,红色边缘表示负相关.边缘越宽越饱和,绝对相关性越强.
例如(这是帮助页面中的第一个示例),以下代码将绘制240变量数据集的相关矩阵.
library("qgraph")
data(big5)
data(big5groups)
qgraph(cor(big5),minimum=0.25,cut=0.4,vsize=2,groups=big5groups,legend=TRUE,borders=FALSE)
title("Big 5 correlations",line=-2,cex.main=2)
Run Code Online (Sandbox Code Playgroud)

您还可以将强关联节点聚类在一起(使用Fruchterman-Reingold),这可以创建相关矩阵结构实际上看起来非常清晰的图像:

还有更多.有关更多示例,请查看我的网站:
http://sachaepskamp.com/?page_id=73
Dir*_*tel 11
我已经为此目的使用heatmap()(或者更确切地说,基础image()功能).我不再使用代码,而且我记得我不得不使用色彩图来获得对[-1,1]范围有意义的东西.
这是一个简单的例子:
R> set.seed(42)
R> X <- matrix(rnorm(100*20), nrow=100)
R> XC <- cor(X)
R> image(XC) # color range could do with improvements here
Run Code Online (Sandbox Code Playgroud)

你可以通过消隐一个下三角或上三角并在其中放置文本来进一步欺骗.该PerformanceAnalytics封装具有的功能chart.Correlation(),做的是(从原始数据矩阵),但它会非常慢,不会扩展到大型矩阵按你原来的问题.我相信还有其他人......
随着pairs您可以产生一些散点图迅速矩阵.如果存在太多变量,您可以使用Rattle的工具:
其他示例:http://rattle.togaware.com/rattle-screenshots.html
事实上,拨浪鼓本身并没有完成大部分分析(正如dwin正确指出的那样),但它提供了(imho)简单的工具来快速运行pca,相关树,如上所述的相关矩阵,而无需操纵数据集以确保例如,数据集中只存在数字变量,...
怎么在相关矩阵上做PCA?然后变量之间的角度显示它们的相关性.
library(HSAUR)
heptathlon
round(cor(heptathlon[,-8]),2) # correlations [without score]
require(vegan)
PCA <- rda(heptathlon[,-8], scale=TRUE) # run a PCA
biplot(PCA, display = "species") # correlation biplot
# The angles between descriptors in the biplot reflect their correlations
Run Code Online (Sandbox Code Playgroud)
