Kol*_*lti 4 plot visualization r
在工作中,当我想要了解数据集(我使用人寿保险中的投资组合数据)时,我通常会使用 Excel 中的数据透视表来查看变量随时间的变化或变量之间的依赖关系等。我记得大学时有一个很好的 R 函数,您可以在其中将数据帧的每一列与其他每一列进行比较,如下所示:
对于问题年龄和持续时间之间的依赖性,该图实际上很有趣,因为您可以清楚地看到高问题年龄伴随着较短的保单持续时间(因为每个保单都有最大年龄)。然而,涉及发行年份的情节iss.year
远不那么“视觉化”。事实上你从他们身上看不到任何东西。我想一目了然地看看不同问题的问题年龄分布是否发生了变化。年份,比如
您可以立即看到,从 2014 年到 2016 年,新签发保单的平均年龄一直在增加。
我不想编写需要为我放入的每个数据集进行自定义的代码,因为这样我还可以在 Excel 中手动更快地完成此操作。
所以我的问题是,是否有一种简单的方法可以使用比标准更灵活的图表类型来绘制矩阵的每一列与其他每一列的关系plot(data.frame)
?
ggpairs()
来自GGally
库的函数。它具有多种可视化所有不同类型的列的功能,并提供了对可视化内容的大量控制。
例如,以下是上面链接的小插图中的一个片段:
data(tips, package = "reshape")
ggpairs(tips)
Run Code Online (Sandbox Code Playgroud)