Map() 和 dplyr 连接

Ros*_*oss 2 r mapply dplyr

我有两个列表,两个列表都包含对应于不同年份的相似数据集。我希望逐个元素合并两个列表中的数据集。当我在变量名称不匹配并且需要使用参数的情况下使用 ,mapply并排​​时,R 无法执行连接。dplyr::full_joinby

library(dplyr)
set.seed(100)

first_list <- list(data.frame(x = 1:3, y = rnorm(3)), 
                   data.frame(x = 4:6, y = rnorm(3)))

second_list <- list(data.frame(z = 1:3, w = rnorm(3)), 
                    data.frame(z = 4:6, w = rnorm(3)))

Map(full_join, by = c("x" = "z"), first_list, second_list)
#Error: 'z' column not found in rhs, cannot join
Run Code Online (Sandbox Code Playgroud)

然而,

Map(function(x, y) full_join(x, y, by = c("x" = "z")), first_list, second_list)
Run Code Online (Sandbox Code Playgroud)

工作成功。我对这种行为很好奇,想知道是否有人可以提供一些解释。

Par*_*ait 5

由于Map是 的包装器mapply,因此使用其MoreArgs参数,而其他必需的参数 (...) 包括要矢量化的列表(请参阅?mapply):

test1 <- Map(full_join, first_list, second_list, MoreArgs=list(by = c("x" = "z")))

test2 <- Map(function(x, y) full_join(x, y, by = c("x" = "z")), first_list, second_list)

all.equal(test1, test2)
# [1] TRUE
Run Code Online (Sandbox Code Playgroud)