R中的P值故障

Lca*_*t91 3 r anova p-value

我对p值有疑问.我一直在比较不同的线性模型,以确定一个模型是否比另一个更好,在R中具有以下功能.

 anova(model1,model2)
Run Code Online (Sandbox Code Playgroud)

不幸的是,偶尔它不会计算F或p值.这是一个没有给出p值的anova摘要的例子

 Analysis of Variance Table

 Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
 Model 2: Influence ~ SortedSums[, B]
    Res.Df   RSS Df Sum of Sq F Pr(>F)
 1    127 3090.9                      
 2    128 2655.2 -1    435.74 
Run Code Online (Sandbox Code Playgroud)

为了对称性,这里也是一个产生p值的anova总结.

 Analysis of Variance Table

 Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
 Model 2: Influence ~ SortedSums[, B]
    Res.Df    RSS Df Sum of Sq      F Pr(>F)
  1    127 3090.9                           
  2    128 3157.6 -1   -66.652 2.7386 0.1004
Run Code Online (Sandbox Code Playgroud)

你知道为什么会这样吗?

bok*_*kov 9

并非所有问题都需要代码示例.你不应该因为新事而被嗤之以鼻,我很抱歉人们做到了.这是答案:

两种模型之间的差异并不显着.

以下是您可以做的事情:

  • 检查以确保一个模型对象的术语是另一个模型对象的术语的超集.否则,默认的anova测试开始时无效(您可以使用AIC比较这些非嵌套模型,但这属于一个单独的问题).实际上,我真的很好奇,想看看嵌套对模型管理是非显著,但再次,它没有必要回答这个问题.
  • 如果您选中了,并且模型是嵌套的,并且这是您手动执行的分析,请在报表中写入p = 1.0并将其称为一天.
  • 如果模型是嵌套的,上面的感觉就像作弊一样,这就是如何做到这一点.你真正要问的anova是,它们不同的一个变量是否对拟合有重大贡献.采取"更大"的模式,做summary(BAR).对应于存在于BAR但缺失的变量FOO的p值是您的p值!并且它可能等于1.并且t统计量的平方是F值.
  • 如果模型是嵌套的,这是分析你正在以编程方式进行,并且缺少p值会破坏脚本中的其他内容,只anova(FOO,BAR)[,5:6]需要获取NAs而不是空白......但是如果你以编程方式执行它,那么再次本来可以尝试的.

祝好运!