昨天我研究了普通最小二乘法(OLS)与主成分分析(PCA)之间差异的一个例子.为了说明我想要显示OLS和PCA最小化的错误,所以我绘制了实际值,预测线,然后我手动(使用GIMP)绘制了一条下拉线来说明一些错误术语.如何编写R中错误行的创建?这是我用于示例的代码:
set.seed(2)
x <- 1:100
y <- 20 + 3 * x
e <- rnorm(100, 0, 60)
y <- 20 + 3 * x + e
plot(x,y)
yx.lm <- lm(y ~ x)
lines(x, predict(yx.lm), col="red")
Run Code Online (Sandbox Code Playgroud)
然后我手动添加黄线以产生以下内容:

?segments
我举了一个例子,但今天我很忙,挑选积分并不复杂.;-)
好的,所以我不是那么忙......
n=58; segments(x[n],y[n],x[n],predict(yx.lm)[n])
n=65; segments(x[n],y[n],x[n],predict(yx.lm)[n])
Run Code Online (Sandbox Code Playgroud)
正如约书亚所说,segments()是去往这里的方式.由于它是完全矢量化的,我们可以一次性添加所有错误,继续您的示例
set.seed(2)
x <- 1:100
y <- 20 + 3 * x
e <- rnorm(100, 0, 60)
y <- 20 + 3 * x + e
plot(x,y)
yx.lm <- lm(y ~ x)
lines(x, predict(yx.lm), col="red")
## Add segments
segments(x, y, x, fitted(yx.lm), col = "blue")
Run Code Online (Sandbox Code Playgroud)
如果您只想突出显示几个错误,那么要修改Joshua给出的示例:
n <- c(58,65)
segments(x[n], y[n], x[n], fitted(yx.lm)[n], col = "orange", lwd = 3)
Run Code Online (Sandbox Code Playgroud)
HTH
G