R堆积百分比条形图,包含二元因子和标签的百分比(使用ggplot)

Ale*_*rov 21 r ggplot2

我想生成一个看起来像这样的图形:

在此输入图像描述

我的原始数据集看起来像这样:

> bb[sample(nrow(bb), 20), ]
      IMG QUANT FIX
25663   1     1   0
7936    2     2   0
23586   3     2   0
23017   2     2   1
31363   1     3   1
7886    2     2   0
23819   3     3   1
29838   2     2   1
8169    2     3   1
9870    2     3   0
31440   2     1   0
35564   3     1   0
24066   1     2   0
12020   3     2   0
6742    3     2   0
6189    2     3   0
26692   2     3   0
1387    3     2   0
31839   2     3   1
28637   3     2   0
Run Code Online (Sandbox Code Playgroud)

因此,我们的想法是条形图显示FIX = 1每个因子QUANT和每个因子的位置IMG.

我已将数据集聚合为百分比 plyr

library(plyr)
bb.perc <- ddply(bb,.(QUANT,IMG),summarise,FIX.PROP = sum(FIX) / length(FIX))
Run Code Online (Sandbox Code Playgroud)

几乎是正确的事情:

  QUANT IMG   FIX.PROP
1     1   1 0.52439024
2     1   2 0.19085366
3     1   3 0.13658537
4     2   1 0.20414201
5     2   2 0.53964497
6     2   3 0.09585799
7     3   1 0.29000000
8     3   2 0.13000000
9     3   3 0.40705882
Run Code Online (Sandbox Code Playgroud)

但是现在如果我制作一个图表,它不会考虑这些FIX==0情况,即所有条形都有相同的高度,即100%,这不是我想要的.请注意各个QUANT子帧的总和不是100%:

> sum(bb.perc[1:3,]$FIX.PROP)
[1] 0.8518293
> sum(bb.perc[4:6,]$FIX.PROP)
[1] 0.839645
> sum(bb.perc[7:9,]$FIX.PROP)
[1] 0.8270588
Run Code Online (Sandbox Code Playgroud)

我能用R做的最好的就是显示计数:

# Take only the positive samples
bb.pos <- bb[bb$FIX == 1,]
# Plot the counts
ggplot(bb,aes(factor(QUANT),fill=factor(IMG))) + geom_bar() +
  scale_y_continuous(labels=percent)
Run Code Online (Sandbox Code Playgroud)

并导致: 在此输入图像描述 这也不是我想要的:

  • 百分比规模很远.我需要一种方法将100%的点传递给 percent函数,但我不知道如何.
  • 它没有标签.

关于SO已经有很多类似的问题了,但我似乎缺乏足够的智力(或对R的理解)来从他们推断出我的特定问题的解决方案.

感谢您的任何指示!

编辑:Sven Hohenstein已经提供了一个答案,但这也是我自己也是这样做的结果:

> ggplot(bb.perc,aes(x=factor(QUANT),y=FIX.PROP,label=paste(round(FIX.PROP*100),
     "%"),fill=factor(IMG)))+ geom_bar(stat="identity") + geom_text(position="stack",
     aes(ymax=1),vjust=5) + scale_y_continuous(labels = percent)
Run Code Online (Sandbox Code Playgroud)

使用bb.perc我进一步定义的那个plyr.这个优点是百分比是按列本地计算的,而不是全局计算的.

谢谢大家的帮助.以下两个问题及其各自的答案帮助我做了大量工作:

带有ggplot2的堆积条形图标签

向ggplot条形图添加标签

我最初做错了,是将position = "fill"参数传递给 geom_bar(),由于某种原因,所有的条都有相同的高度!

Sve*_*ein 23

这是一种生成图的方法:

ggplot(bb[bb$FIX == 1, ],aes(x = factor(QUANT), fill = factor(IMG), 
                             y = (..count..)/sum(..count..))) +
 geom_bar() +
 stat_bin(geom = "text",
          aes(label = paste(round((..count..)/sum(..count..)*100), "%")),
          vjust = 5) +
 scale_y_continuous(labels = percent)
Run Code Online (Sandbox Code Playgroud)

更改vjust参数的值以调整标签的垂直位置.

在此输入图像描述