我有一个使用3类数据的分组箱图.一个类别设置为箱图的x轴,另一个设置为填充,最后一个设置为分面类别.我想显示每个填充组stat_summary的平均值,但是仅使用给出了x轴类别的平均值,而没有分离填充的平均值:
这是当前的代码:
demoplot<-ggplot(demo,aes(x=variable,y=value))
demoplot+geom_boxplot(aes(fill=category2),position=position_dodge(.9))+
stat_summary(fun.y=mean, colour="black", geom="point", shape=18, size=4,) +
facet_wrap(~category1)
Run Code Online (Sandbox Code Playgroud)
有没有办法显示每个类别2的均值,而无需手动计算和绘制点数?调整位置闪避并没有多大帮助,因为它只是一个计算平均值.是否可以在mean()函数内创建条件?
感谢对此的任何启示.
根据受访者的性别分类,我一直在寻找一种能够将堆积条形图响应显示为百分比值的方法.
我成功地使用变量'sex'创建了一个堆积条形图用于填充,但我希望该图显示该变量之间的比例.我知道使用(..count ..)/ sum(.. count)和scale_y可以更改y轴,以便显示百分比,但我找不到将其用于我想要的方法.手动执行具有反映百分比的频率值[编辑]的单独数据框也是可能的,但我真的热衷于寻找仅使用ggplot的方法.
这是当前的代码:
workday<-ggplot(student,aes(x=Dalc2,fill=sex))
plot1<-workday+geom_bar()+facet_wrap(~romantic2)+labs(title="Workday Alcohol Consumption",y="Number of Respondents",x="Response")+ylim(0,300)
Run Code Online (Sandbox Code Playgroud)
我知道这是一个非常基本的问题,但是对这一问题的任何启示都将非常感激.
(来自uci.edu的数据集)
编辑:
对于那些对解决方案感兴趣的人,r.bot(非常感谢!)建议使用 geom_bar(position="fill")
同时添加它来修改y轴:
scale_y_continuous(labels=percent)
我正在尝试训练从文档术语矩阵转换为数据帧的数据。正面和负面评论有单独的字段,因此我想在列名称中添加一个字符串作为“标签”,以区分来自不同字段的相同单词 - 例如,单词 hello 可以同时出现在正面和负面评论字段中(因此,在我的数据框中表示为一列),因此在我的模型中,我想通过将列名称设为 Positive_hello 和 Negative_hello 来区分它们。
我正在寻找一种重命名列的方法,以便将特定字符串附加到数据框中的所有列。比如说,对于mtcars,我想将所有列重命名为以“_sample”结尾,这样列名就会变成mpg_sample、cyl_sample、disp_sample等等,而原来是mpg、cyl、 和disp。
我正在考虑使用sapplyor lapply,但还没有任何进展。任何帮助将不胜感激。