Lau*_*ura 2 loops for-loop r dataframe
我有一个数据框:
results 2 (612 obs. 281 variables)
ID Q1000_p2000_2016 Q1893_p2039_2016 .... Q1000_p2000_2017 Q1893_p2039_2017
1 392 381 422 351
2 432 293 398 310
. . . . .
. . . . .
Run Code Online (Sandbox Code Playgroud)
在2016年有140个问题,2017年有140个问题,每年这些问题使用相同的名称,但每个变量名称在末尾都有"_2016"或"_2017"用来区分时间段。
和另一个数据框:
absdiff (0 obs. 141 variables)
ID Q1000_p2000 Q1893_p2039 ....
Run Code Online (Sandbox Code Playgroud)
我想通过为每个问题的两年取绝对差值来指定absdiff的值ID。
在我的条件下,我检查了结果2中2016年的问题编号(或变量名的前几个字符)是否与2017年的问题编号匹配。
如果成立,我想将两个答案的绝对差分配给absdiff中的相应变量/问题编号
我用过
for (q in 2:141){
if (substr(colnames(results2[q]),1,12) == substr(colnames(results2[q+140]),1,12)){
for (j in 1:nrow(results2)){absdiff$substr(colnames(results2[q]),1,11) <- abs(results2[j,q] - results2[j,(q+140)])}
}
else
print("ERROR")
}
Run Code Online (Sandbox Code Playgroud)
但我收到此错误消息:
absdiff $ substr(colnames(results2 [q]),1,11)<-abs(results2 [j,:复杂赋值中的无效函数)中的错误
什么问题导致此错误消息?我如何解决它?
为了进行复制,可以将其全部简化为:
ID <- c(1,2)
Q1000_p2000_2016 <- c(392,432)
Q1893_p2039_2016 <- c(381,293)
Q1000_p2000_2017 <- c(422,398)
Q1893_p2039_2017 <- c(351,310)
results2 <- as.data.frame(cbind(ID, Q1000_p2000_2016, Q1893_p2039_2016 ,Q1000_p2000_2017, Q1893_p2039_2017 ))
absdiff <- results2[FALSE,1:3]
for (q in 2:3){
if (substr(colnames(results2[q]),1,12) == substr(colnames(results2[q+2]),1,12)){
for (j in 1:nrow(results2)){absdiff$substr(colnames(results2[q]),1,11) <- abs(results2[j,q] - results2[j,(q+2)])}
}
else
print("ERROR")
}
Run Code Online (Sandbox Code Playgroud)
不要使用循环,而要向量化。获取2016列,2017列,然后减去:
col2016<-grep("_2016$",names(results2),value=TRUE)
col2017<-grep("_2017$",names(results2),value=TRUE)
absdiff<-results2[,col2017]-results2[,col2016]
# Q1000_p2000_2017 Q1893_p2039_2017
#1 30 -30
#2 -34 17
Run Code Online (Sandbox Code Playgroud)
要保留该ID列,只需在以下位置添加它:
absdiff$ID<-results2$ID
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
123 次 |
| 最近记录: |