我有一个数据框,其数据如下:
A B C D
a1 b1 c1 d1
a1 b1 c2 d2
a1 b1 c3 d3
a2 b2 c1 d1
a2 b2 c3 d3
Run Code Online (Sandbox Code Playgroud)
我将如何将其转化为?
A B c1 c2 c3
a1 b1 d1 d2 d3
a2 b2 d1 d3
Run Code Online (Sandbox Code Playgroud)
在基数R中,您可以使用reshape():
reshape(mydf, direction = "wide", idvar = c("A", "B"), timevar = "C")
# A B D.c1 D.c2 D.c3
# 1 a1 b1 d1 d2 d3
# 4 a2 b2 d1 <NA> d3
Run Code Online (Sandbox Code Playgroud)
您也可以像以下一样使用tidyr和dplyr组合:
library(dplyr)
# devtools::install_github("hadley/tidyr")
library(tidyr)
mydf %>% group_by(A, B) %>% spread(C, D)
# Source: local data frame [2 x 5]
#
# A B c1 c2 c3
# 1 a1 b1 d1 d2 d3
# 2 a2 b2 d1 NA d3
Run Code Online (Sandbox Code Playgroud)
这是使用该reshape2库的好地方.你可以这样做
library(reshape2)
dcast(dd, A+B~C)
Run Code Online (Sandbox Code Playgroud)
要得到
A B c1 c2 c3
1 a1 b1 d1 d2 d3
2 a2 b2 d1 <NA> d3
Run Code Online (Sandbox Code Playgroud)
如预期的.