Ste*_*eve 1 statistics sas linear-regression
如您所知,使用选项CORRB,您可以让 SAS 中的逻辑回归或线性回归输出估计矩阵的相关性。有趣的是,我不知道如何阅读这个矩阵。我有两个明显强正相关的变量。从中PROC CORR,我可以看出这两个变量的皮尔逊相关系数是0.7+。但是来自逻辑回归和线性回归的估计矩阵给了我 -0.7。相关性的强度大致相似,但符号相反。谁能解释一下?非常感谢。
您正在正确阅读这些值,它们只是意味着不同的东西。PROC CORR 为您提供变量的相关性,而 CORRB 是模型中这些变量的系数的相关性。
这是对为什么正相关预测变量将具有负相关系数的直观解释。假设y = a + b1*x1 + b2*x2 + eps。如果b1从回归中获得的最佳值稍微增加一点,那么 for 的预测值y也会增加(对于正x1),并使整体拟合更差。对此进行补偿并使预测值更接近观察值的一种方法是减少 b2:由于 的高值x1与 的高值相关联x2,因此您将返回接近原始拟合。这表明 的不确定性b2与 的不确定性呈负相关b1:增加一个同时减少另一个将导致类似的拟合。
看看完美相关的极端情况可能会有所启发:x2=x1。那么以下内容将为您提供完全相同的预测:
y = 1 + 2*x + 3*x
y = 1 + 3*x + 2*x
y = 1 + 9*x + (-4)*x
etc
Run Code Online (Sandbox Code Playgroud)
所以b2 = 5-b1和系数有一个完美的负相关。