小编diz*_*irl的帖子

在ggplot boxplot中的填充组中显示单独的平均值

我有一个使用3类数据的分组箱图.一个类别设置为箱图的x轴,另一个设置为填充,最后一个设置为分面类别.我想显示每个填充组stat_summary的平均值,但是仅使用给出了x轴类别的平均值,而没有分离填充的平均值:

这是当前的代码:

demoplot<-ggplot(demo,aes(x=variable,y=value))
demoplot+geom_boxplot(aes(fill=category2),position=position_dodge(.9))+
stat_summary(fun.y=mean, colour="black", geom="point", shape=18, size=4,) +
facet_wrap(~category1)

Run Code Online (Sandbox Code Playgroud)

有没有办法显示每个类别2的均值,而无需手动计算和绘制点数？调整位置闪避并没有多大帮助,因为它只是一个计算平均值.是否可以在mean()函数内创建条件？

对于任何感兴趣的人,这里是数据:

感谢对此的任何启示.

plot r ggplot2 boxplot

diz*_*irl

2016 03-19

7
推荐指数

1
解决办法

5562
查看次数

使用ggplot在R中创建堆积百分比条形图

根据受访者的性别分类,我一直在寻找一种能够将堆积条形图响应显示为百分比值的方法.

我成功地使用变量'sex'创建了一个堆积条形图用于填充,但我希望该图显示该变量之间的比例.我知道使用(..count ..)/ sum(.. count)和scale_y可以更改y轴,以便显示百分比,但我找不到将其用于我想要的方法.手动执行具有反映百分比的频率值[编辑]的单独数据框也是可能的,但我真的热衷于寻找仅使用ggplot的方法.

这就是情节目前的样子:

这是当前的代码:

workday<-ggplot(student,aes(x=Dalc2,fill=sex))
plot1<-workday+geom_bar()+facet_wrap(~romantic2)+labs(title="Workday Alcohol Consumption",y="Number of Respondents",x="Response")+ylim(0,300)

Run Code Online (Sandbox Code Playgroud)

我知道这是一个非常基本的问题,但是对这一问题的任何启示都将非常感激.

(来自uci.edu的数据集)

编辑:

对于那些对解决方案感兴趣的人,r.bot(非常感谢!)建议使用 geom_bar(position="fill")

同时添加它来修改y轴: scale_y_continuous(labels=percent)

这就是最终图表的样子

plot r ggplot2

diz*_*irl

2016 03-10

5
推荐指数

1
解决办法

9888
查看次数

将特定字符串添加到 R 数据框中的所有列名称的最佳方法是什么？

我正在尝试训练从文档术语矩阵转换为数据帧的数据。正面和负面评论有单独的字段，因此我想在列名称中添加一个字符串作为“标签”，以区分来自不同字段的相同单词 - 例如，单词 hello 可以同时出现在正面和负面评论字段中（因此，在我的数据框中表示为一列），因此在我的模型中，我想通过将列名称设为 Positive_hello 和 Negative_hello 来区分它们。

我正在寻找一种重命名列的方法，以便将特定字符串附加到数据框中的所有列。比如说，对于mtcars，我想将所有列重命名为以“_sample”结尾，这样列名就会变成mpg_sample、cyl_sample、disp_sample等等，而原来是mpg、cyl、和disp。

我正在考虑使用sapplyor lapply，但还没有任何进展。任何帮助将不胜感激。

nlp r text-mining dataframe

diz*_*irl

2017 05-19

3
推荐指数

1
解决办法

8956
查看次数