如何为离散值生成有意义的绘图员/关联图

Pat*_*thy 5 analytics r correlation

我最喜欢的探索性分析工具之一是pairs(),在有限数量的离散值的情况下,它会因为点完全对齐而下降.考虑以下:

y <- t(rmultinom(n=1000,size=4,prob=rep(.25,4)))
pairs(y)
Run Code Online (Sandbox Code Playgroud)

它并没有真正给出良好的相关性.会有另一种情节风格吗?

Vin*_*ent 7

如果将y更改为data.frame,则可以添加一些"jitter",使用col选项可以设置透明度级别(rgb中的第4个数字):

y <- data.frame(y)
pairs(sapply(y,jitter), col = rgb(0,0,0,.2))
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

或者你可以使用ggplot2的plotmatrix:

library(ggplot2)
plotmatrix(y) + geom_jitter(alpha = .2)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

编辑:由于ggplot2中的plotmatrix已被弃用,请使用ggpairs(上面的@ hadley评论中提到的GGally包)

library(GGally)
ggpairs(y, lower = list(params = c(alpha = .2, position = "jitter")))
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述