我正在使用包含16个问题的数据集,其中响应集是相同的(是,否,未知或缺失).我正在使用R处理数据,我希望将每个变量转换为一个因子.对于单个变量,我可以使用以下构造:
df <- read.csv("thedata.csv")
df$q1 <- factor(x=df$q1,levels=c(-9,0,1),
labels=c("Unknown or Missing","No","Yes))
Run Code Online (Sandbox Code Playgroud)
我想避免输入16次.我可以用a来做for(),但我想知道是否有更清晰,更R的方法来做到这一点.一些样本数据:
structure(list(q1 = c(0, 0, 0, -9, 0), q2 = c(0, 0, 1, 0, 0),
q3 = c(0, 0, 1, 0, 0), q4 = c(1, 1, 0, 0, 0),
q5 = c(0, 1, 1, 1, 1), q6 = c(1, 1, 1, 0, 0),
q7 = c(0, 0, 0, 1, 0), q8 = c(0, 0, 1, 1, 1),
q9 = c(1, 0, -9, 1, 0), q10 = c(1, 0, 0, 0, 0),
q11 = c(0, 1, 1, 0, 0), q12 = c(1, 1, 0, 0, 0),
q13 = c(1, -9, 1, 0, 0), q14 = c(0, 0, 0, 1, 1),
q15 = c(1, 0, 1, 1, 0), q16 = c(1, 1, 1, 1, 1)),
.Names = c("q1", "q2", "q3", "q4", "q5", "q6", "q7",
"q8", "q9", "q10", "q11", "q12", "q13",
"q14", "q15", "q16"),
row.names = c(NA, -5L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud)
42-*_*42- 20
df[] <- lapply(df, factor,
levels=c(-9, 0, 1),
labels = c("Unknown or Missing", "No", "Yes"))
str(df)
Run Code Online (Sandbox Code Playgroud)
可能要快于应用或者需要data.frame来改革/重新分类这些结果.这里的诀窍是[]在赋值的LHS上使用保留了目标的结构(因为R"知道"它的类和维度是什么,并且不需要data.frame列表中的lapply需要.如果你想要这样做只有选定的列才能执行此操作:
df[colnums] <- lapply(df[colnums], factor,
levels=c(-9, 0, 1),
labels = c("Unknown or Missing", "No", "Yes"))
str(df)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
9145 次 |
| 最近记录: |