从R中的实际点到建模点丢弃线

JD *_*ong 7 graphics r lm

昨天我研究了普通最小二乘法(OLS)与主成分分析(PCA)之间差异的一个例子.为了说明我想要显示OLS和PCA最小化的错误,所以我绘制了实际值,预测线,然后我手动(使用GIMP)绘制了一条下拉线来说明一些错误术语.如何编写R中错误行的创建?这是我用于示例的代码:

set.seed(2)
x <- 1:100

y <- 20 + 3 * x
e <- rnorm(100, 0, 60)
y <- 20 + 3 * x + e

plot(x,y)
yx.lm <- lm(y ~ x)
lines(x, predict(yx.lm), col="red")
Run Code Online (Sandbox Code Playgroud)

然后我手动添加黄线以产生以下内容:

替代文字

Jos*_*ich 9

?segments

我举了一个例子,但今天我很忙,挑选积分并不复杂.;-)

好的,所以我不是那么忙......

n=58; segments(x[n],y[n],x[n],predict(yx.lm)[n])
n=65; segments(x[n],y[n],x[n],predict(yx.lm)[n])
Run Code Online (Sandbox Code Playgroud)


Rei*_*son 7

正如约书亚所说,segments()是去往这里的方式.由于它是完全矢量化的,我们可以一次性添加所有错误,继续您的示例

set.seed(2)
x <- 1:100

y <- 20 + 3 * x
e <- rnorm(100, 0, 60)
y <- 20 + 3 * x + e

plot(x,y)
yx.lm <- lm(y ~ x)
lines(x, predict(yx.lm), col="red")
## Add segments
segments(x, y, x, fitted(yx.lm), col = "blue")
Run Code Online (Sandbox Code Playgroud)

如果您只想突出显示几个错误,那么要修改Joshua给出的示例:

n <- c(58,65)
segments(x[n], y[n], x[n], fitted(yx.lm)[n], col = "orange", lwd = 3)
Run Code Online (Sandbox Code Playgroud)

HTH

G