我正在阅读文档,data.table
并且还注意到了一些关于SO的对话,这些对话rbindlist
应该比我更好rbind
.
我想知道为什么rbindlist
比真正优秀的rbind
场景更好?rbindlist
rbind
在内存利用方面有什么优势吗?
我想合并一大组数据框(大约 30 个),每个数据框有大约 200 个变量。这些数据集非常相似但不完全相同。
请在下面找到两个示例数据框:
library(data.table)
library(haven)
df1 <- fread(
"A B C iso year
0 B 1 NLD 2009
1 A 2 NLD 2009
0 Y 3 AUS 2011
1 Q 4 AUS 2011
0 NA 7 NLD 2008
1 0 1 NLD 2008
0 1 3 AUS 2012",
header = TRUE
)
df2 <- fread(
"A B D E iso year
0 1 1 NA ECU 2009
1 0 2 0 ECU 2009
0 0 3 0 …
Run Code Online (Sandbox Code Playgroud) 我有一个data.table'DT',其中一列('col2')是一个数据帧列表:
require(data.table)
DT <- data.table(col1 = c('A','A','B'),
col2 = list(data.frame(colA = c(1,3,54, 23),
colB = c("aa", "bb", "cc", "hh")),
data.frame(colA =c(23, 1),
colB = c("hh", "aa")),
data.frame(colA = 1,
colB = "aa")))
> DT
col1 col2
1: A <data.frame>
2: A <data.frame>
3: B <data.frame>
>> DT$col2
[[1]]
colA colB
1 1 aa
2 3 bb
3 54 cc
4 23 hh
[[2]]
colA colB
1 23 hh
2 1 aa
[[3]]
colA colB
1 1 aa
Run Code Online (Sandbox Code Playgroud)
col2中的每个data.frame都有两列colA和colB.我想要一个data.table输出,它根据DT的col1 绑定那些data.frames的每个唯一 …