在R中,当调查长度不同时,如何计算卡方检验中的预期值?

Luk*_*uke 1 r chi-squared

我正在进行一项行为研究,我想看看一个物种在三个时期内是否显示出与预期显着不同的反应.有47个独立的物种观测,每个观测有三个时期,总观测时间为8.6分钟.第一期为3分钟,第二期为0.6分钟,第三期为5分钟.在每个时期,动物可以积极或消极地作出反应.在第一阶段,有两个阳性反应(47个观察结果中; 45个阴性),在第二个时期,47个反应中有13个是阳性,而在第三个时期,47个反应中有14个是阳性.

因此,我试图运行一个chisquare测试,我调整零假设中的概率来纠正周期之间的时间差异,但我认为我没有正确地做到这一点.

data<-c(2,13,14)
null.probs<-c(3/8.6, 0.6/8.6, 5/8.6)
chi<-chisq.test(data, p=null.probs)
Run Code Online (Sandbox Code Playgroud)

我相当肯定在这种情况下我对这些期望值的零假设是不正确的,但我不确定如何正确调整它.

42-*_*42- 6

如果你运行一个glm带有"泊松"错误的拟合,你会获得一个以卡方分布的偏差统计量.您可以将计数用作结果,并添加一个偏移项,该偏移项log(time)将根据不同的观察长度进行调整.

> counts<-c(2, 13, 14)
> times<-c(3, 0.6, 5)
> glm(counts ~ letters[1:3] +offset( log(times)), family="poisson")

Call:  glm(formula = counts ~ letters[1:3] + offset(log(times)), family = "poisson")

Coefficients:
  (Intercept)  letters[1:3]b  letters[1:3]c  
      -0.4055         3.4812         1.4351  

Degrees of Freedom: 2 Total (i.e. Null);  0 Residual
Null Deviance:      36.68 
Residual Deviance: 1.776e-15    AIC: 17.52 

Degrees of Freedom: 2 Total (i.e. Null);  0 Residual
Null Deviance:      36.68 
Residual Deviance: 1.776e-15    AIC: 17.52 
Run Code Online (Sandbox Code Playgroud)

你已经完全安装了一个只有两个自由度的模型.因此,确切的拟合显然将解释所有数据.您用于推理的是从泊松均值中记录(计数)的总和.(如果任何计数为零,将会出现可预测的问题.)