bri*_*ndk 9 statistics r ggplot2
现在,我正在创建一个多预测线性模型并生成诊断图来评估回归假设.(这是我目前喜欢的多元回归分析统计课程:-)
我的教科书(Cohen,Cohen,West和Aiken 2003)建议根据残差绘制每个预测因子,以确保:
在第(2)点,我的教科书有这样的说法:
一些统计软件包允许分析人员在残差平均值(0线),低于平均值的1个标准差和低于残差平均值的1个标准偏差下绘制低值拟合线....在本案例中{他们的例如,两条线{mean + 1sd和mean - 1sd}大致平行于lowess {0}线,与残差的方差不随X变化的解释一致.(p.131)
我知道如何使用"0行"生成散点图:
# First, I'll make a simple linear model and get its diagnostic stats
library(ggplot2)
data(cars)
mod <- fortify(lm(speed ~ dist, data = cars))
attach(mod)
str(mod)
# Now I want to make sure the residuals are homoscedastic
qplot (x = dist, y = .resid, data = mod) +
geom_smooth(se = FALSE) # "se = FALSE" Removes the standard error bands
Run Code Online (Sandbox Code Playgroud)
但有没有人知道如何使用ggplot2和qplot生成0线,"平均值+ 1sd"和"平均值 - 1sd"线将叠加的情节?这是一个奇怪/复杂的问题吗?
各位,我想为我的无知道歉。哈德利是绝对正确的,答案一直就在我面前。正如我怀疑的那样,我的问题源于统计,而不是程序上的无知。
geom_smooth()默认为loess平滑,并且它会叠加 +1sd 和 -1sd 线作为处理的一部分。这就是哈德利所说的“这不就是 68% 的置信区间吗?”的意思。我完全忘记了 68% 的间隔是什么,并一直在寻找我已经知道该怎么做的东西。我实际上通过指定 来关闭代码中的置信区间,这并没有帮助geom_smooth(se = FALSE)。
# First, I'll make a simple linear model and get its diagnostic stats.
library(ggplot2)
data(cars)
mod <- fortify(lm(speed ~ dist, data = cars))
attach(mod)
str(mod)
# Now I want to make sure the residuals are homoscedastic.
# By default, geom_smooth is loess and includes the 68% standard error bands.
qplot (x = dist, y = .resid, data = mod) +
geom_abline(slope = 0, intercept = 0) +
geom_smooth()
Run Code Online (Sandbox Code Playgroud)
Hadley 实现了一种非常美丽且简单的方法来获得我一直想要的东西。但因为我专注于黄土线,所以我忽略了这样一个事实:68% 置信区间是以我需要的线为边界的。抱歉给大家添麻烦了。
| 归档时间: |
|
| 查看次数: |
2859 次 |
| 最近记录: |