R中二项式数据的置信区间?

Pig*_*Pig 16 statistics r probability confidence-interval

我知道我需要使用mean和sd来找到间隔,但是,如果问题是:

A survey of 1000 randomly chosen workers, 520 of them are female. Create a 95% confidence interval for the proportion of wokrers who are female based on survey.

我如何为此找到平均值和标准差?

Geo*_*tas 23

您也可以使用prop.teststats,或binom.test

prop.test(x, n, conf.level=0.95, correct = FALSE)

        1-sample proportions test without continuity correction

data:  x out of n, null probability 0.5
X-squared = 1.6, df = 1, p-value = 0.2059
alternative hypothesis: true p is not equal to 0.5
95 percent confidence interval:
 0.4890177 0.5508292
sample estimates:
   p 
0.52 
Run Code Online (Sandbox Code Playgroud)

您可能会发现这篇文章很有意思,在第861页的表1中给出了不同的置信区间,对于单个比例,使用七种方法计算(对于n和r的选定组合).使用prop.test您可以获得表格第3行和第4行中的结果,同时binom.test返回第5行中显示的结果.


Zby*_*nek 14

在这种情况下,您具有二项分布,因此您将计算二项式比例置信区间.

在R中,您可以使用binconf()Hmisc

> binconf(x=520, n=1000)
 PointEst     Lower     Upper
     0.52 0.4890177 0.5508292
Run Code Online (Sandbox Code Playgroud)

或者您可以自己计算:

> p <- 520/1000
> p + c(-qnorm(0.975),qnorm(0.975))*sqrt((1/1000)*p*(1-p))
[1] 0.4890345 0.5509655
Run Code Online (Sandbox Code Playgroud)

  • 你可以用`qnorm(0.975)`替换你的1.96 (5认同)

小智 10

另外,使用功能,propCIprevalence包装,以获得五个最常用的二项式置信区间:

> library(prevalence)
> propCI(x = 520, n = 1000)
    x    n    p        method level     lower     upper
1 520 1000 0.52 agresti.coull  0.95 0.4890176 0.5508293
2 520 1000 0.52         exact  0.95 0.4885149 0.5513671
3 520 1000 0.52      jeffreys  0.95 0.4890147 0.5508698
4 520 1000 0.52          wald  0.95 0.4890351 0.5509649
5 520 1000 0.52        wilson  0.95 0.4890177 0.5508292
Run Code Online (Sandbox Code Playgroud)


Car*_*oft 5

另一个包: tolerance 将计算大量典型分布函数的置信度/容差范围。