使用for循环模拟t检验p值

Sim*_*mon 0 statistics loops r

对于这个项目,我需要使用R脚本来模拟t检验的有效性.我必须使用for循环将用于执行以下2000次:

循环看起来像这样

i <- 1
for (i <= 2001) { 
    x <-rf(5,df1=5,df2=10)
    b <- df2
    p.value <-t.test(x,mu=(b/(b-2))$p.value
    i <- i+1
}
Run Code Online (Sandbox Code Playgroud)

Cal*_*imo 6

在你编写它的方式中,它将是一个"while"循环.

对于R中的循环,具有以下语法:

for (i in 1:2000) {
    df1 <- 5
    df2 <- 10
    x <-rf(5, df1=df1, df2=df2)
    b <- df2
    p.value <- t.test(x, mu=(b/(b-2)))$p.value
}
Run Code Online (Sandbox Code Playgroud)

此外,使用"apply"构造可能更有效,例如使用replicate,并将df包含为函数参数:

get.p.value <- function(df1, df2) {
        x <- rf(5, df1=df1, df2=df2)
        p.value <- t.test(x, mu=(df2/(df2-2)))$p.value
    }
replicate (2000, get.p.value(df1 = 5, df2 = 10))
Run Code Online (Sandbox Code Playgroud)

这并非总是如此,但它简化了p.values的恢复.

  • 在您的第一个解决方案中,您可以在循环中进行分配.id不需要2000次分配相同的值.所以它可以像`df1 <-5; df2 <-b <-10; for(i in 1:2000)p.value < - t.test(rf(5,df1 = df1,df2 = df2),亩=(b /(b-2)))$ p.value` (2认同)
  • 你是正确的马雷克,df1,df2,b的分配(为什么b首先?)应该不在循环中.甚至mu也可以预先计算出来.为了保存p.values,最糟糕的是在`for`循环中使用`p.values < - c(p.values,t.test(...))`生成一个向量.`replicate`以某种方式在开始时预先分配所需长度的向量,并避免缓慢的内存重新分配.对于长计算,请考虑可以显示进度条的`plyr`包. (2认同)