比方说我有:
v = rep(c(1,2, 2, 2), 25)
Run Code Online (Sandbox Code Playgroud)
现在,我想计算每个唯一值出现的次数.unique(v) 返回唯一值的内容,但不返回它们的数量.
> unique(v)
[1] 1 2
Run Code Online (Sandbox Code Playgroud)
我想要一些能给我的东西
length(v[v==1])
[1] 25
length(v[v==2])
[1] 75
Run Code Online (Sandbox Code Playgroud)
但作为一个更一般的单线:)有点接近(但不完全)像这样:
#<doesn't work right> length(v[v==unique(v)])
Run Code Online (Sandbox Code Playgroud) 我正在做一个基本的箱子图,其中y=age和x=Patient groups
age <- ggplot(data, aes(factor(group2), age)) + ylim(15, 80)
age + geom_boxplot(fill = "grey80", colour = "#3366FF")
Run Code Online (Sandbox Code Playgroud)
我希望你能用一些东西来帮助我:
1)是否可以在每个组框图上面包括每组的观察次数(但不是在我的组标签所在的X轴上),而不必在油漆中执行此操作:)?我尝试过使用:
age + annotate("text", x = "CON", y = 60, label = "25")
Run Code Online (Sandbox Code Playgroud)
CON第一组在哪里,就在y = 60这个组的箱线图上方.但是,该命令不起作用.我认为它有一些事情可以做,它x是一个连续的而不是一个分类的变量.
2)尽管有很多关于使用平均值而不是中位数的问题,我仍然没有找到适合我的代码?
3)在同样的问题上你有没有办法在箱线图中包含平均组数据?也许用
age + stat_summary(fun.y=mean, colour="red", geom="point")
Run Code Online (Sandbox Code Playgroud)
然而,它只包括一个平均所在的点.或者再次使用
age + annotate("text", x = "CON", y = 30, label = "30")
Run Code Online (Sandbox Code Playgroud)
哪一个CON是第一组,y = 30是〜组年龄均值.知道如何灵活和丰富的ggplot2语法,我希望有一种更优雅的方式来使用真实的统计输出而不是annotate.
任何建议/链接将不胜感激!
谢谢!!
有没有办法在R中创建一个框图,它将在框中显示(某处)"N =(样本大小)"?varwidth logical根据样本大小调整框的宽度,但不允许在不同的图之间进行比较.
FWIW,我以下列方式使用boxplot命令,其中'f1'是一个因素:
boxplot(xvar ~ f1, data=frame, xlab="input values", horizontal=TRUE)
Run Code Online (Sandbox Code Playgroud) 我有一个数据,我正在绘制的ggplot2箱形图看起来像
> head(varf)
sID variable value
1 SP_SA036,SA040 CM0001 0.492537313
2 SP_SA036,SA040 CM0001 0.479564033
3 SP_SA036,SA040 CM0001 0.559139785
4 SP_SA036,SA040 CM0001 0.526806527
5 SP_SA036,SA040 CM0001 0.009049774
6 SP_SA036,SA040 CM0001 0.451612903
Run Code Online (Sandbox Code Playgroud)
变量列包含16个不同的ID(从CM0001到CM0016)
我有一个带注释的数据框
category annotation
CM001 HG4450
CM002 HG3288
..
CM016 MM8998
Run Code Online (Sandbox Code Playgroud)
我想将这些注释映射到我的箱图上,但是找不到办法,将geom_text与boxplot一起使用的正确语法是什么?
谢谢
我想用每组中的观察数量来注释我的小提琴情节.所以问题基本上与这个问题相同,除了:
让我们从Seaborn API文档中获取此示例:
import seaborn as sns
sns.set_style("whitegrid")
tips = sns.load_dataset("tips")
ax = sns.violinplot(x="day", y="total_bill", data=tips)
Run Code Online (Sandbox Code Playgroud)
我希望在小提琴之上有n = 62,n = 19,n = 87,并且n = 76.这可行吗?