Lyn*_*ndz 6 r time-series ggplot2 trendline
我试图使用ggplot在一个时间序列中绘制多个趋势线(每十年).
这是数据:
dat <- structure(list(YY = 1961:2010, a = c(98L, 76L, 83L, 89L, 120L,
107L, 83L, 83L, 92L, 104L, 98L, 91L, 81L, 69L, 86L, 76L, 85L,
86L, 70L, 81L, 77L, 89L, 60L, 80L, 94L, 66L, 77L, 85L, 77L, 80L,
79L, 79L, 65L, 70L, 80L, 87L, 84L, 67L, 106L, 129L, 95L, 79L,
67L, 105L, 118L, 85L, 86L, 103L, 97L, 106L)), .Names = c("YY",
"a"), row.names = c(NA, -50L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud)
这是脚本:
p <- ggplot(dat, aes(x = YY))
p <- p + geom_line(aes(y=a),colour="blue",lwd=1)
p <- p + geom_point(aes(y=a),colour="blue",size=2)
p <- p + theme(panel.background=element_rect(fill="white"),
plot.margin = unit(c(0.5,0.5,0.5,0.5),"cm"),
panel.border=element_rect(colour="black",fill=NA,size=1),
axis.line.x=element_line(colour="black"),
axis.line.y=element_line(colour="black"),
axis.text=element_text(size=15,colour="black",family="serif"),
axis.title=element_text(size=15,colour="black",family="serif"),
legend.position = "top")
p <- p + scale_x_discrete(limits = c(seq(1961,2010,5)),expand=c(0,0))
p <- p + geom_smooth(data=dat[1:10,],aes(x=YY,y=a),method="lm",se=FALSE,color="black",formula=y~x,linetype="dashed")
p <- p + geom_smooth(data=dat[11:20,],aes(x=YY,y=a),method="lm",se=FALSE,color="black",formula=y~x,linetype="dashed")
p <- p + geom_smooth(data=dat[21:30,],aes(x=YY,y=a),method="lm",se=FALSE,color="black",formula=y~x,linetype="dashed")
p <- p + geom_smooth(data=dat[31:40,],aes(x=YY,y=a),method="lm",se=FALSE,color="black",formula=y~x,linetype="dashed")
p <- p + geom_smooth(data=dat[41:50,],aes(x=YY,y=a),method="lm",se=FALSE,color="black",formula=y~x,linetype="dashed")
p <- p + labs(x="Year",y="Number of Days")
outImg <- paste0("test",".png")
ggsave(outImg,p,width=8,height=5)
Run Code Online (Sandbox Code Playgroud)
这是结果图像:
我想要/有什么问题
我想提取斜率并将它们添加到图中的趋势线上.如何从geom_smooth()中提取每条线的斜率?
目前,我正在逐一绘制趋势线.我想知道是否有一种有效的方法可以通过可调节的时间窗口进行此操作.例如,假设我想绘制每5年的趋势线.在上图中,时间窗口为10.
假设,我只想绘制重要的趋势线(即p值<0.05,null:没有趋势或斜率等于0),是否可以用geom_smooth()实现这一点?
我会感激任何帮助.
因此,在将数据传输到ggplot2之前,最好处理这些任务中的每一个,但是使用tidyverse中的一些其他软件包可以很容易地完成这些任务.
从问题1和2开始:
虽然ggplot2可以绘制回归线,但要提取估计的斜率系数,您需要lm()明确地使用对象.使用group_by()和mutate(),您可以添加分组变量(例如,下面的代码仅针对5年组执行此操作),然后计算并仅将斜率估计值提取到现有数据框中的列中.然后可以使用该geom_text()调用在ggplot中绘制那些斜率估计值.我在下面以快速而肮脏的方式完成了这项工作(将每个标签放在它们回归的x和y值的平均值上),但您可以在数据框中指定它们的确切位置.
对变量和数据准备进行分组也使得问题2变得轻而易举:既然您在数据框中明确地拥有了分组变量,则无需逐个绘制,geom_smooth()接受group美学.
此外,要回答问题3,您可以从lm对象的摘要中提取pvalue,并仅过滤那些对您关注的级别有重要意义的pvalue.如果您现在通过这个完整的数据框geom_smooth(),geom_text()您将获得您正在寻找的情节!
library(tidyverse)
# set up our base plot
p <- ggplot(dat, aes(x = YY, y = a)) +
geom_line(colour = "blue", lwd = 1) +
geom_point(colour = "blue", size = 2) +
theme(
panel.background = element_rect(fill = "white"),
plot.margin = unit(c(0.5, 0.5, 0.5, 0.5), "cm"),
panel.border = element_rect(colour = "black", fill = NA, size = 1),
axis.line.x = element_line(colour = "black"),
axis.line.y = element_line(colour = "black"),
axis.text = element_text(size = 15, colour = "black", family = "serif"),
axis.title = element_text(size = 15, colour = "black", family = "serif"),
legend.position = "top"
) +
scale_x_discrete(limits = c(seq(1961, 2010, 5)), expand = c(0, 0))
# add a grouping variable (or many!)
prep5 <- dat %>%
mutate(group5 = rep(1:10, each = 5)) %>%
group_by(group5) %>%
mutate(
slope = round(lm(YY ~ a)$coefficients[2], 2),
significance = summary(lm(YY ~ a))$coefficients[2, 4],
x = mean(YY), # x coordinate for slope label
y = mean(a) # y coordinate for slope label
) %>%
filter(significance < .2) # only keep those with a pvalue < .2
p + geom_smooth(
data = prep5, aes(x = YY, y = a, group = group5), # grouping variable does the plots for us!
method = "lm", se = FALSE, color = "black",
formula = y ~ x, linetype = "dashed"
) +
geom_text(
data = prep5, aes(x = x, y = y, label = slope),
nudge_y = 12, nudge_x = -1
)
Run Code Online (Sandbox Code Playgroud)

现在,您可能希望在指定文本标签的位置时比我在此处更加小心.我使用了手段和nudge_*参数geom_text()来做一个快速的例子,但请记住,因为这些值被明确映射到x和y坐标,你可以完全控制!
由reprex包创建于2018-07-16 (v0.2.0).