我正在做一个基本的箱子图,其中y=age和x=Patient groups
age <- ggplot(data, aes(factor(group2), age)) + ylim(15, 80)
age + geom_boxplot(fill = "grey80", colour = "#3366FF")
Run Code Online (Sandbox Code Playgroud)
我希望你能用一些东西来帮助我:
1)是否可以在每个组框图上面包括每组的观察次数(但不是在我的组标签所在的X轴上),而不必在油漆中执行此操作:)?我尝试过使用:
age + annotate("text", x = "CON", y = 60, label = "25")
Run Code Online (Sandbox Code Playgroud)
CON第一组在哪里,就在y = 60这个组的箱线图上方.但是,该命令不起作用.我认为它有一些事情可以做,它x是一个连续的而不是一个分类的变量.
2)尽管有很多关于使用平均值而不是中位数的问题,我仍然没有找到适合我的代码?
3)在同样的问题上你有没有办法在箱线图中包含平均组数据?也许用
age + stat_summary(fun.y=mean, colour="red", geom="point")
Run Code Online (Sandbox Code Playgroud)
然而,它只包括一个平均所在的点.或者再次使用
age + annotate("text", x = "CON", y = 30, label = "30")
Run Code Online (Sandbox Code Playgroud)
哪一个CON是第一组,y = 30是〜组年龄均值.知道如何灵活和丰富的ggplot2语法,我希望有一种更优雅的方式来使用真实的统计输出而不是annotate.
任何建议/链接将不胜感激!
谢谢!!
另一个帮助在Linux 上安装nloptr包(Ubuntu 14.04.4 LTS).我查看了许多问题,但没有找到解决方案.
我无法在R(版本3.3.1/Rstudio版本0.99.902)作为安装的安装包lme4 nloptr具有非零退出状态.当我尝试
install.package("nloptr")
Run Code Online (Sandbox Code Playgroud)
我得到以下内容:
Installing package into ‘/home/rd14/R/x86_64-pc-linux-gnu-library/3.3’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/src/contrib/nloptr_1.0.4.tar.gz'
Content type 'unknown' length 353942 bytes (345 KB)
==================================================
downloaded 345 KB
* installing *source* package ‘nloptr’ ...
** package ‘nloptr’ successfully unpacked and MD5 sums checked
checking for g++... g++
checking whether the C++ compiler works... yes
checking for C++ compiler default output file name... a.out
checking for suffix of executables...
checking whether we are cross compiling... …Run Code Online (Sandbox Code Playgroud) 我目前正在处理大型数据集,即使文件格式转换每个主题至少花费一个小时,因此我经常不确定我的命令是否已执行或程序是否已冻结.我想知道是否有人知道如何跟踪我试图在linux中运行的命令/脚本的进度?
非常感谢您的帮助.
我正在运行 2 个连续 VAR 之间的部分相关性,我想使用从以下内容中提取的估计来可视化该关联:
library(ppcor)
pcor.test(Y~X, Z, data, method="spearman")
estimate p.value statistic n gp Method
0.3997551 0.0007318872 3.543037 69 1 spearman
Run Code Online (Sandbox Code Playgroud)
使用部分回归图进行可视化
Y_resid<-resid(lm(Y~Z,data))
X_resid<-resid(lm(X~Z,data))
library(ggplot2)
m<-ggplot(data, aes(x=X_resid, y=Y_resid)) +
geom_point() +
labs(x="X | Z", y = "Y | Z")+
scale_size_manual(values=c(15))+
theme_classic()
m + geom_smooth(method=lm)
Run Code Online (Sandbox Code Playgroud)
这
geom_smooth(method=lm, formula= y~x)
Run Code Online (Sandbox Code Playgroud)
然而,选项显然与基于 Spearman 的 pcor 函数的估计不对应。
有没有办法制作 XY(resid) 图并使用 pcor.test 的估计值拟合一条线?
提前致谢
我想使用sns.jointplot可视化存在两个组时X和Y之间的关联。但是,在
tips = sns.load_dataset("tips")
sns.jointplot("total_bill", "tip", data=tips)
Run Code Online (Sandbox Code Playgroud)
没有像其他sns图(例如sns.scatterplot)中的“色相”选项。如何在散点图以及两个重叠的密度图中为不同的组(例如hue =“ smoker”)分配不同的颜色。
在该R这可以通过如创建两个边缘密度图散点图来完成此。
什么是sns?如果在sns中无法做到这一点,是否可以使用另一个python软件包?