使用线性回归的两个不同预测之间出现意外差异

Ale*_* C. 3 r linear-regression ggplot2

ggplot2用来绘制一些时间序列数据和线性回归线.我有兴趣确定回归线何时达到82%.目视检查图表显示这将发生在2017年11月15日左右.但是当我使用R的predict.lm()功能时,我得到了一个不同的答案:2017年8月12日.这两种方法不应该给我相同的答案吗?最后,我想用一个显示拦截日期的文本标签来注释图形.

require(ggplot2)
temp <- "End.Date    Save.Rate
1       2015-05-31     0.67
2       2015-07-31     0.67
3       2015-09-30     0.69
4       2015-11-30     0.71
5       2016-01-30     0.70
6       2016-03-31     0.72"

df <- read.table(text = temp, header = TRUE)
df$End.Date <- as.POSIXct(df$End.Date, origin="1970-01-01", tzone="America/New_York")

save.rate.lm = lm(End.Date ~ Save.Rate, data=df)
newdata <- data.frame(Save.Rate = 0.82)
temp <- predict.lm(save.rate.lm, newdata)
predicted.date <- as.POSIXct(as.data.frame(temp)[1,], origin="1970-01-01",
                             tzone="America/New_York")
print(predicted.date)

x.lims <- c(as.POSIXct(NA), as.POSIXct("2017-12-31", origin="1970-01-01",
                                       tzone="America/New_York"))
p <- ggplot(df, aes(x=End.Date, y=Save.Rate)) +
  geom_point() +
  stat_smooth(method='lm', fill=NA, fullrange=TRUE) + 
  theme(axis.text.x=element_text(angle = -45, hjust = 0)) +
  scale_y_continuous(labels = percent) +
  scale_x_datetime(breaks = date_breaks('month'), labels = date_format('%b-%Y'),
                   limits=x.lims) +
  geom_hline(yintercept=0.82)
print(p)
Run Code Online (Sandbox Code Playgroud)

Ben*_*ker 6

你不能只是反转线性回归(即date ~ 1+ratevs rate ~ 1 +date)并期望得到相同的答案(例如,在CrossValidated上看到这个问题).据我所知predict.lm,在逆向回归中没有简单的方法可以得到你想要的答案.您需要根据日期拟合利率并使用某些代数来获得预测日期.下面我展示一个适合您特定问题的简单计算; 这个问题的答案和这个问题为您提供了一些额外的固定解决方案......

fit2 = lm(Save.Rate ~ End.Date, data=df)
## y = a + bx
## x* = (y-a)/b
cc <- coef(fit2)
pred.date <- as.POSIXct((0.82-cc[1])/cc[2],origin="1970-01-01",
                             tzone="America/New_York")
##               (Intercept) 
## "2017-11-19 17:26:28 EST" 
Run Code Online (Sandbox Code Playgroud)

图片:

p+geom_vline(xintercept=as.numeric(pred.date),lty=2)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述