Pat*_*thy 5 analytics r correlation
我最喜欢的探索性分析工具之一是pairs(),在有限数量的离散值的情况下,它会因为点完全对齐而下降.考虑以下:
y <- t(rmultinom(n=1000,size=4,prob=rep(.25,4)))
pairs(y)
Run Code Online (Sandbox Code Playgroud)
它并没有真正给出良好的相关性.会有另一种情节风格吗?
如果将y更改为data.frame,则可以添加一些"jitter",使用col选项可以设置透明度级别(rgb中的第4个数字):
y <- data.frame(y)
pairs(sapply(y,jitter), col = rgb(0,0,0,.2))
Run Code Online (Sandbox Code Playgroud)

或者你可以使用ggplot2的plotmatrix:
library(ggplot2)
plotmatrix(y) + geom_jitter(alpha = .2)
Run Code Online (Sandbox Code Playgroud)

编辑:由于ggplot2中的plotmatrix已被弃用,请使用ggpairs(上面的@ hadley评论中提到的GGally包)
library(GGally)
ggpairs(y, lower = list(params = c(alpha = .2, position = "jitter")))
Run Code Online (Sandbox Code Playgroud)
