我试图总结家庭调查的数据,因此我的大多数数据都是分类(因子)数据.我希望用某些问题的回答频率来总结它(例如,回答某些问题的家庭百分比的条形图,误差条显示置信区间).我发现这个优秀的教程我认为是我祷告的答案(http://www.cookbook-r.com/Manipulating_data/Summarizing_data/)但事实证明这只会对连续数据有所帮助.
我需要的是类似的东西,这将允许我计算这些比例的计数和标准误差/置信区间的比例.
基本上我希望能够为我的调查数据中提出的每个问题生成如下所示的汇总表:
# X5employf X5employff N(count) proportion SE of prop. ci of prop
# 1 1 20 0.64516129 ? ?
# 1 2 1 0.03225806 ? ?
# 1 3 9 0.29032258 ? ?
# 1 NA 1 0.290322581 ? ?
# 2 4 1 0.1 ? ?
structure(list(X5employf = structure(c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L), .Label = c("1", "2", "3"), class = "factor"), X5employff = structure(c(1L, 2L, 3L, NA, …Run Code Online (Sandbox Code Playgroud)