我试图弄清楚如何在我最近进行的调查中分析多个选择/多个答案(即"选择所有适用的")问题.
SPSS具有很好的分析在线调查数据和这些类型的问题的能力,所以我猜测R有这个和更多.处理这些调查答案在Excel中有点棘手.例如,给我一个直方图/分布每个人都喜欢草莓和巧克力冰淇淋的年龄.
如何构建数据集以及执行频率,帕累托和逻辑AND函数的一些基本表格的命令是什么?
我没有找到任何与SPSS中的多响应集一样方便的东西.但是,您可以根据常用列名称相对轻松地创建组,然后使用任何apply()函数或朋友迭代每个组.这是adply()从plyr包中使用的一种方法:
library(plyr)
set.seed(1)
#Fake data with three "like" questions. 0 = non selected, 1 = selected
dat <- data.frame(resp = 1:10,
like1 = sample(0:1, 10, TRUE),
like2 = sample(0:1, 10, TRUE),
like3 = sample(0:1, 10, TRUE)
)
adply(dat[grepl("like", colnames(dat))], 2, function(x)
data.frame(Count = as.data.frame(table(x))[2,2],
Perc = as.data.frame(prop.table(table(x)))[2,2]))
#-----
X1 Count Perc
1 like1 6 0.6
2 like2 5 0.5
3 like3 3 0.3
Run Code Online (Sandbox Code Playgroud)