假设我有一些数据,我创建了一个线性模型来拟合数据.然后我使用ggplot2绘制数据,我想将线性模型添加到绘图中.据我所知,这是标准的做法(使用内置cars数据集):
library(ggplot2)
fit <- lm(dist ~ speed, data = cars)
summary(fit)
p <- ggplot(cars, aes(speed, dist))
p <- p + geom_point()
p <- p + geom_smooth(method='lm')
p
Run Code Online (Sandbox Code Playgroud)
但是,上面违反了DRY原则('不要重复自己'):它涉及在调用中创建线性模型lm,然后在调用中重新创建它geom_smooth.这对我来说似乎不优雅,它也为bug提供了空间.例如,如果我更改了创建的模型lm但忘记更改使用创建的模型geom_smooth,则摘要和绘图将不是同一模型.
有没有办法使用ggplot2绘制已经存在的线性模型,例如将lm对象本身传递给geom_smooth函数?
小智 8
我相信你想做一些事情:
library(ggplot2)
# install.packages('dplyr')
library(dplyr)
fit <- lm(dist ~ speed, data = cars)
cars %>%
mutate( my_model = predict(fit) ) %>%
ggplot() +
geom_point( aes(speed, dist) ) +
geom_line( aes(speed, my_model) )
Run Code Online (Sandbox Code Playgroud)
只要定义了相应的预测方法,这也适用于更复杂的模型。否则,您将需要自己定义它。
在线性模型的情况下,您可以通过稍多的工作添加置信/预测带并重现您的绘图。
我们需要做的是创建一个新数据框,其中包含来自旧模型的观测值加上模型中的预测值,然后使用ggplot2绘制该数据框.
library(ggplot2)
# create and summarise model
cars.model <- lm(dist ~ speed, data = cars)
summary(cars.model)
# add 'fit', 'lwr', and 'upr' columns to dataframe (generated by predict)
cars.predict <- cbind(cars, predict(cars.model, interval = 'confidence'))
# plot the points (actual observations), regression line, and confidence interval
p <- ggplot(cars.predict, aes(speed,dist))
p <- p + geom_point()
p <- p + geom_line(aes(speed, fit))
p <- p + geom_ribbon(aes(ymin=lwr,ymax=upr), alpha=0.3)
p
Run Code Online (Sandbox Code Playgroud)
这样做的最大好处是,如果改变模型(例如cars.model <- lm(dist ~ poly(speed, 2), data = cars)),那么情节和摘要都会改变.
感谢Plamen Petrov让我意识到这里需要什么.正如他所指出的,只有predict为相关模型定义时,这种方法才有效; 如果没有,就必须自己定义.
| 归档时间: |
|
| 查看次数: |
7547 次 |
| 最近记录: |