将两列合并为R中的一列

yon*_*rnz 27 merge r

我有以下数据框,我试图将两列合并为一个,同时用NA数值替换's.

ID    A     B
1     3     NA
2     NA    2
3     NA    4
4     1     NA
Run Code Online (Sandbox Code Playgroud)

我想要的结果是:

ID    New
1     3
2     2
3     4
4     1
Run Code Online (Sandbox Code Playgroud)

提前致谢!

jza*_*dra 14

当答案写完时,这可能不存在,但是因为我带着相同的问题来到这里并找到了更好的解决方案,这里是未来的googlers:

你想要的是以下coalesce()功能dplyr:

y <- c(1, 2, NA, NA, 5)
z <- c(NA, NA, 3, 4, 5)
coalesce(y, z)

[1] 1 2 3 4 5
Run Code Online (Sandbox Code Playgroud)


Hao*_*Hao 13

在这种情况下另一个非常简单的解决方案是使用该rowSums功能.

df$New<-rowSums(df[, c("A", "B")], na.rm=T)
df<-df[, c("ID", "New")]
Run Code Online (Sandbox Code Playgroud)

更新:感谢@Artem Klevtsov提到此方法仅适用于数字数据.


Use*_*598 12

你也可以这样做: with(d,ifelse(is.na(A),B,A))

d你的数据框在哪里.

  • 仅当NA在一列或另一列中独占时才有效!但这种特殊情况的好方法! (4认同)

Col*_*vel 11

您可以使用unitetidyr:

library(tidyr)

df[is.na(df)] = ''
unite(df, new, A:B, sep='')
#  ID new
#1  1   3
#2  2   2
#3  3   4
#4  4   1
Run Code Online (Sandbox Code Playgroud)


akr*_*run 7

你可以试试

New <- do.call(pmax, c(df1[-1], na.rm=TRUE))
Run Code Online (Sandbox Code Playgroud)

要么

New <-  df1[-1][cbind(1:nrow(df1),max.col(!is.na(df1[-1])))]
d1 <- data.frame(ID=df1$ID, New)
d1
#  ID New
#1  1   3
#2  2   2
#3  3   4
#4  4   1
Run Code Online (Sandbox Code Playgroud)


Kro*_*ome 5

假设A或B都有一个NA,那就可以了:

# creating initial data frame (actually data.table in this case)
library(data.table)
x<- as.data.table(list(ID = c(1,2,3,4), A = c(3, NA, NA, 1), B = c(NA, 2, 4, NA)))
x
#   ID  A  B
#1:  1  3 NA
#2:  2 NA  2
#3:  3 NA  4
#4:  4  1 NA


#solution
y[,New := na.omit(c(A,B)), by = ID][,c("A","B"):=NULL]
y
#   ID New
#1:  1   3
#2:  2   2
#3:  3   4
#4:  4   1
Run Code Online (Sandbox Code Playgroud)

  • 太好了!另外,`y [,New:= pmin(A,B,na.rm = TRUE)]` (2认同)