ggpairs在GGally包中看起来非常有用,但是当NA数据集中的任何地方存在时它似乎失败:
#require(GGally)
data(tips, package="reshape")
pm <- ggpairs(tips[,1:3]) #works just fine
#introduce NA
tips[1,1] <- NA
ggpairs(tips[,1:3])
> Error in if (lims[1] > lims[2]) { : missing value where TRUE/FALSE needed
Run Code Online (Sandbox Code Playgroud)
我没有看到任何处理NA值的文档,并且ggpairs(tips[,1:3], na.rm=TRUE)(不出所料)解决方案不会更改错误消息.
我有一个数据集,其中可能有10%的值NA随机分散在整个数据集中.因此na.omit(myDataSet)将删除大部分数据.有没有办法解决?
GGally类似的一些函数ggparcoord()支持通过missing=[exclude,mean,median,min10,random]参数处理 NA。然而不幸的是,情况并非如此ggpairs()。
您可以做的就是用对数据的良好估计来替换 NA,您期望它ggpair()会自动为您完成。有一些很好的解决方案,例如用行均值、零、中位数甚至最近点替换它们(注意最近句子单词上的 4 个超链接!)。