SQL中的线性回归置信区间

Mat*_*lls 7 sql math statistics

我正在使用一些相当直接的SQL代码来计算一些(x,y)数据点的回归系数(截距和斜率),使用最小二乘法.这给了我一个很好的最佳线条数据.但是,我们希望能够看到最佳拟合线的95%和5%置信区间(下面的曲线).

链接文字http://www.curvefit.com/2a03be60.gif

这些意味着真正的线具有低于上曲线的95%概率和高于低曲线的95%概率.我该如何计算这些曲线?我已经阅读了维基百科等并完成了一些谷歌搜索,但我还没有找到可理解的数学方程式来计算这个.

编辑:这是我现在所拥有的精髓.

--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)

declare @slope real
declare @intercept real

--calculate slope and intercept
select 
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr
Run Code Online (Sandbox Code Playgroud)

先感谢您.

Pow*_*ser 0

尝试这个网站并向下滚动到中间。对于最佳拟合线的每个点,您都知道 Z、样本大小和标准偏差。

http://www.stat.yale.edu/Courses/1997-98/101/confint.htm