我有两个列表,两个列表都包含对应于不同年份的相似数据集。我希望逐个元素合并两个列表中的数据集。当我在变量名称不匹配并且需要使用参数的情况下使用 ,mapply并排时,R 无法执行连接。dplyr::full_joinby
library(dplyr)
set.seed(100)
first_list <- list(data.frame(x = 1:3, y = rnorm(3)),
data.frame(x = 4:6, y = rnorm(3)))
second_list <- list(data.frame(z = 1:3, w = rnorm(3)),
data.frame(z = 4:6, w = rnorm(3)))
Map(full_join, by = c("x" = "z"), first_list, second_list)
#Error: 'z' column not found in rhs, cannot join
Run Code Online (Sandbox Code Playgroud)
然而,
Map(function(x, y) full_join(x, y, by = c("x" = "z")), first_list, second_list)
Run Code Online (Sandbox Code Playgroud)
工作成功。我对这种行为很好奇,想知道是否有人可以提供一些解释。
由于Map是 的包装器mapply,因此使用其MoreArgs参数,而其他必需的参数 (...) 包括要矢量化的列表(请参阅?mapply):
test1 <- Map(full_join, first_list, second_list, MoreArgs=list(by = c("x" = "z")))
test2 <- Map(function(x, y) full_join(x, y, by = c("x" = "z")), first_list, second_list)
all.equal(test1, test2)
# [1] TRUE
Run Code Online (Sandbox Code Playgroud)