R平方并用一个预测器调整R平方

Emm*_*bbs 1 statistics matlab regression

使用以下方法估算MATLAB中的确定系数:

load hospital
y = hospital.BloodPressure(:,1);
X = double(hospital(:,2:5));
X2 = X(:,3);
mdl = fitlm(X2,y);

Estimated Coefficients:
                   Estimate       SE       tStat       pValue  
                   ________    ________    ______    __________

    (Intercept)      116.72      3.9389    29.633    1.0298e-50
    x1             0.039357    0.025208    1.5613       0.12168


Number of observations: 100, Error degrees of freedom: 98
Root Mean Squared Error: 6.66
R-squared: 0.0243,  Adjusted R-Squared 0.0143
F-statistic vs. constant model: 2.44, p-value = 0.122
Run Code Online (Sandbox Code Playgroud)

如果我只在线性模型中使用一个预测变量,为什么R 2和adjust-R 2值不相同.如果模型中只有一个预测变量,则它们应该是可互换的.我在这里错过了什么?

Dan*_*Dan 5

维基百科给出了adjust-R 2的两个定义:

在此输入图像描述

在此输入图像描述

我猜你的断言R 2应该等于adjust-R 2是基于第一个等式,因为当p1时,第二项的分子为0.现在我找不到这方面的参考(令人失望的是在维基文章的这一部分没有引用)但我相当确信第一个方程实际上是一个近似值.

第二个等式,除了符号也与统计学习导论第212页上的等式6.4相匹配,将与R 2不同,因为df en - p - 1df t只是n - 1,因此存在差异当p等于1(即只有一个解释变量)时为1,但差异应该很小.这是一个随机的例子,它有一个R 2和adjust-R 2的表,即使变量的数量是1,也显示出差异.

但你的差异非常大.我建议你看看剩余的平方和和平方和,看看你是否可以计算你自己的R 2和调整后的R 2值,看看它们是否匹配.