这些方框代表连续变量在组内的分布;红色圆圈是显示所有实际观察结果的点。到目前为止,一切都很好。geom_boxplot如果用+geom_point来满足群体审美的话,这会很简单。
这里有两个曲折:
一些背景信息:该图显示了产品的使用情况(Y 轴)与允许的使用情况(X 轴)。X 轴组是互斥的、离散的层,本质上是一个无限的、连续的使用变量。EG、1-4、5-9、10-20 等。从视觉角度来看,在这些组中绘制连续图对我来说并不觉得疯狂,这有意义吗?但我不知道如何开始ggplot2同意我的观点。
我的偏好是让箱形图沿 X 轴均匀分布,但如果我需要从连续的轴开始,并且让各组在 X 轴上占据成比例的空间,那么我会满足于此(可能使用记录轴以防止下部狭窄的组被完全压碎。
这应该作为示例数据:
df <- structure(list(usage = c(1L, 4L, 2L, 5L, 4L, 1L, 2L, 98L, 9L,
4L, 6L, 6L, 1L, 2L, 2L, 2L, 3L, 2L, 5L, 1L), allowed = c(2, 20,
3, 3, 5, 5, 1, 1, 1, 5, 10, 5, 7, 12, 2, 5, 23, 10, 5, 2), id = c(1055L,
2155L, 6637L, …Run Code Online (Sandbox Code Playgroud)