我有一个数据框如下.我想计算1每一行的出现次数并插入一个包含该信息的新列:
df1
Cluster a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 a10
1 C1 0 1 1 1 0 1 1 1 1 1 1
2 C2 0 1 1 1 0 1 1 1 1 1 1
3 C3 0 1 0 0 0 0 1 0 0 0 0
4 C4 0 1 1 1 0 1 1 1 1 1 1
5 C5 0 1 1 1 0 1 1 1 1 1 1
Run Code Online (Sandbox Code Playgroud)
我希望结果如下:
df1
Cluster a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 X
1 C1 0 1 1 1 0 1 1 1 1 1 1 9
2 C2 0 1 1 1 0 1 1 1 1 1 1 9
3 C3 0 1 0 0 0 0 1 0 0 0 0 2
4 C4 0 1 1 1 0 1 1 1 1 1 1 9
5 C5 0 1 1 1 0 1 1 1 1 1 1 9
Run Code Online (Sandbox Code Playgroud)
我更喜欢使用mutate函数dplyr
我喜欢用select_if里面rowSums来概括链.
编辑:如果您需要解决NA值,请使用中的na.rm选项rowSums
df1 %>%
mutate(X = rowSums(select_if(., is.numeric) == 1, na.rm = TRUE))
Run Code Online (Sandbox Code Playgroud)