我正在处理一个大型数据集,以蓟作为预测因素之一,研究几个地理区域的疾病病例。我试过用抖动创建箱线图,但不能很清楚地解释它。有人可以帮忙吗?
这是代码:
ggplot(factor(Region), Cases, data=orf, geom=c("boxplot", "jitter"),
main=" Cases by Thistles and Regions",fill=factor(Thistles),
xlab="Regions", ylab="Number of cases")
Run Code Online (Sandbox Code Playgroud)
这是一个非常大的数据集,所以这里只是一小部分:
Region Thistles Cases
1 1 40
1 2 0
1 1 8
1 3 73
1 3 0
1 1 26
1 2 0
1 1 45
1 4 0
1 4 22
1 0 0
2 3 46
1 0 10
2 1 6
2 1 539
2 1 0
2 2 0
2 1 60
2 1 0
2 1 …Run Code Online (Sandbox Code Playgroud)