使用 geom_bar 和 stat="identity" 绘制平均值的 hline

c0b*_*bra 5 r mean ggplot2 geom-bar

我有一个条形图,其中确切的条形高度位于数据框中。

df <- data.frame(x=LETTERS[1:6], y=c(1:6, 1:6 + 1), g=rep(x = c("a", "b"), each=6))

ggplot(df, aes(x=x, y=y, fill=g, group=g)) + 
  geom_bar(stat="identity", position="dodge")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

现在我想添加两条显示每组所有条形图平均值的 hlines。我所得到的一切

ggplot(df, aes(x=x, y=y, fill=g, group=g)) + 
  geom_bar(stat="identity", position="dodge") +
  stat_summary(fun.y=mean, aes(yintercept=..y.., group=g), geom="hline")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

由于我也想对任意数量的组执行此操作,因此我希望仅使用 ggplot 提供解决方案。

我想避免这样的解决方案,因为它不完全依赖于传递给 ggplot 的数据集,具有冗余代码并且组数不灵活:

ggplot(df, aes(x=x, y=y, fill=g, group=g)) + 
  geom_bar(stat="identity", position="dodge") +
  geom_hline(yintercept=mean(df$y[df$g=="a"]), col="red") +
  geom_hline(yintercept=mean(df$y[df$g=="b"]), col="green")
Run Code Online (Sandbox Code Playgroud)

提前致谢!

编辑:

  • 添加的数据集
  • 对结果代码进行评论
  • 更改数据和图表以澄清问题

Z.L*_*Lin 6

如果我正确理解你的问题,你的第一种方法就差不多了:

ggplot(df, aes(x = x, y = y, fill = g, group = g)) + 
  geom_col(position="dodge") + # geom_col is equivalent to geom_bar(stat = "identity")
  stat_summary(fun.y = mean, aes(x = 1, yintercept = ..y.., group = g), geom = "hline")
Run Code Online (Sandbox Code Playgroud)

阴谋

根据帮助文件stat_summary

stat_summary对唯一的 x 进行操作;...

在这种情况下,默认继承了和stat_summary的顶级美学映射,因此它将计算每个 g 值的每个 x的平均 y 值,从而产生大量水平线。添加到的映射覆盖(同时保留),因此我们得到每个 g 值的单个平均 y 值。x = xgroup = gx = 1stat_summaryx = xgroup = g