我正在使用 R 中 MASS 库中的活检数据集。我正处于创建逻辑回归模型的初始阶段,以了解哪些变量对罹患恶性肿瘤的概率有影响。我删除了所有缺失数据的行(大约 16 个观察值)。所有变量本身都很重要,因此我从包含所有变量的最完整模型开始,第三个变量(V3 - 细胞大小的均匀性)是这个最完整模型中最不重要的变量。
我创建了另一个模型,删除了 V3。然后我想使用 anova() 函数来查看两个模型的拟合是否存在显着差异。但是,我从方差分析测试中没有得到 p 值。这是否意味着 p 值接近 1?我的模型设置中是否有错误?
感谢所有输入!
#post removal of rows with missing data from biopsy in library(MASS)
relevel(biopsy$class, ref = "malignant")
#assigns value of interst to malignant instead of benign.
fullest.model = glm(biopsy$class~biopsy[,2]+biopsy[,3]+biopsy[,4]+biopsy[,5]+
biopsy[,6]+biopsy[,7]+biopsy[,8]+biopsy[,9]+biopsy[,10]
,family = binomial(link = "logit"))
model1 = glm(biopsy$class~biopsy[,2]+biopsy[,4]+biopsy[,5]+
biopsy[,6]+biopsy[,7]+biopsy[,8]+biopsy[,9]+biopsy[,10]
,family = binomial(link = "logit"))
anova(model1, fullest.model)
Run Code Online (Sandbox Code Playgroud)
我得到的输出:
Resid. Df Resid. Dev Df Deviance
1 674 102.89
2 673 102.89 1 0.00090001
Run Code Online (Sandbox Code Playgroud)
^看不到p值!