R：t.test 和pairwise.t.test 给出不同的结果？

Question

R：t.test 和pairwise.t.test 给出不同的结果？

我尝试对以下数据帧使用 R 进行 t 检验。

df <- structure(list(freq = c(9, 11, 14, 12, 10, 9, 16, 10, 11, 15, 
13, 12, 12, 13, 13, 9, 16, 14, 12, 15, 16, 10, 11, 13, 14, 14, 
14, 16, 8, 10, 14, 14, 11, 11, 11, 11, 13, 7, 12, 13, 14, 11, 
11, 13, 10, 14, 10, 10, 12, 8, 9, 12, 14, 11, 12, 12, 14, 14, 
14, 15, 12, 13, 14, 8, 9, 11, 10, 14, 12, 12, 9, 10, 8, 14, 11, 
14, 9, 13, 13, 13, 10, 9, 13, 10, 13, 10, 13, 12, 11, 12, 10, 
12, 8, 11, 12, 15, 12, 12, 11, 13, 12, 10, 13, 9, 11, 9, 11, 
8, 12, 12, 12, 10, 11, 12, 9, 13, 14, 11, 11, 14, 13, 12, 14, 
15, 12, 12, 12, 14), class = structure(c(3L, 3L, 2L, 2L, 2L, 
2L, 2L, 3L, 2L, 3L, 4L, 4L, 4L, 4L, 3L, 2L, 3L, 2L, 1L, 4L, 1L, 
4L, 1L, 4L, 2L, 2L, 3L, 3L, 2L, 4L, 1L, 4L, 4L, 4L, 3L, 3L, 3L, 
2L, 1L, 4L, 3L, 3L, 1L, 4L, 1L, 2L, 2L, 3L, 3L, 4L, 2L, 2L, 3L, 
3L, 2L, 2L, 2L, 1L, 1L, 2L, 1L, 1L, 4L, 1L, 1L, 1L, 2L, 2L, 3L, 
2L, 3L, 2L, 3L, 3L, 4L, 2L, 1L, 4L, 1L, 1L, 3L, 2L, 2L, 2L, 3L, 
1L, 1L, 1L, 1L, 3L, 4L, 4L, 4L, 4L, 4L, 1L, 1L, 1L, 3L, 3L, 4L, 
4L, 3L, 4L, 4L, 4L, 4L, 3L, 3L, 1L, 4L, 4L, 1L, 4L, 4L, 1L, 3L, 
1L, 2L, 2L, 1L, 2L, 1L, 1L, 3L, 3L, 2L, 1L), .Label = c("ending", 
"mobile", "stem.first", "stem.second"), class = "factor")), .Names = c("freq", 
"class"), row.names = c(NA, -128L), class = "data.frame")

Run Code Online (Sandbox Code Playgroud)

正如我在上一篇文章中读到的，在 R 中有不止一种方法可以做到这一点。我尝试使用t.test-function 和使用pairwise.t.test-function。

对于使用，t.test我通过要比较的类对数据帧进行了子集化，并在子集上运行了后续的 t 检验。

ending.vs.mobile <- df[df$class=="ending"|df$class=="mobile",]
ending.vs.first <- df[df$class=="ending"|df$class=="stem.first",]
ending.vs.second <- df[df$class=="ending"|df$class=="stem.second",]
mobile.vs.first <- df[df$class=="mobile"|df$class=="stem.first",]
mobile.vs.second <- df[df$class=="mobile"|df$class=="stem.second",]
first.vs.second <- df[df$class=="stem.first"|df$class=="stem.second",]

t.test(ending.vs.mobile$freq ~ ending.vs.mobile$class, var.equal=T) 
t.test(ending.vs.first$freq ~ ending.vs.first$class, var.equal=T) 
t.test(ending.vs.second$freq ~ ending.vs.second$class, var.equal=T) 
t.test(mobile.vs.first$freq ~ mobile.vs.first$class, var.equal=T) 
t.test(mobile.vs.second$freq ~ mobile.vs.second$class, var.equal=T) 
t.test(first.vs.second$freq ~ first.vs.second$class, var.equal=T)

Run Code Online (Sandbox Code Playgroud)

据我所知（这里我可能错了）pairwise.t.test这里会更方便，因为我不需要创建所有子集并且可以在原始数据帧上运行它。

pairwise.t.test(df$freq, df$class, p.adjust.method="none", paired=FALSE, pooled.sd=FALSE)

Run Code Online (Sandbox Code Playgroud)

但是，我在这里得到了不同的结果，最明显的是比较结尾与 stem.second 的比较：p=0.7 usingt.test和 p=0.1 using pairwise.t.test。

这里有什么问题？我在哪里做过某事。错误的？

虽然问题本身解决了，但我认为它发生的原因让我有点偏执（不再相信自己）：仅仅通过输入pooled.sd而不是pool.sd我没有得到我期望的结果。这不是很容易出错吗？

在许多其他情况下，您可以键入变体，例如bonfor bonferroni、fa()orfactor()等。但是这里pooled.sd完全被忽略了，尽管实际上是“pooled sd”。好吧，如果你彻底阅读了输出的标题，你可以猜到它pooled.sd没有被识别出来，因为它仍然说“t tests with pooled SD”但是如果我什至不打印这个怎么办，例如当将输出传输到自我时 -写函数？有可能永远无法识别此错误。

我应该写信给 R 的一些开发人员，在 R 的未来版本中，这两种拼写变体都应该有效吗？

Answer 1

Bri*_*ggs 6

问题不在于 p 值校正，而在于（声明）方差假设。你var.equal=T在你的t.test电话和pooled.sd=FALSE你的pairwise.t.test电话中使用过。但是，的论点pairwise.t.test是pool.sd，不是pooled.sd。改变这一点，得到的 p 值等同于对t.test

pairwise.t.test(df$freq, df$class, p.adjust.method="none", 
                paired=FALSE, pool.sd=FALSE)

Run Code Online (Sandbox Code Playgroud)

归档时间：	13 年，3 月前
查看次数：	11705 次
最近记录：	6 年，4 月前