合并两个数据框列表

ale*_*e19 6 r list dataframe dplyr

我有两个要合并的大数据框列表。这是数据的示例。

list1 = list(data.frame(Wvlgth = c(337, 337.5, 338, 338.5, 339, 339.5),
            Global = c(".9923+00",".01245+00", ".0005+00", ".33421E+00", ".74361+00", ".129342+00"),
            group = c(0,0,0,0,0,0)),
            data.frame(Wvlgth = c(337, 337.5, 338, 338.5, 339, 339.5),
            Global = c(".1284+00",".0098+00", ".7853+00", ".2311+00", ".1211+00", ".75345+00"),
            group = c(1,1,1,1,1,1)))

list2 = list(data.frame(Wvlgth = c(337, 337.5, 338, 339),
                time = c("13.445","13.445", "13.445", "13.445"),
                IRD = c(.01324, .34565, .92395, .67489)),
                data.frame(Wvlgth = c(337, 337.5, 338, 339),
                time = c("13.45361","13.45361", "13.45361", "13.45361"),
                IRD = c(.20981, .98703, .54092, .38567)))
Run Code Online (Sandbox Code Playgroud)

我想通过“Wvlgth”将 list1 的每个数据帧与 list2 的每个数据帧合并,以获得如下内容:

Wvlgth    time      IRD        Global      group
337       13.445    0.01324    .9923+00        0
337.5     13.445    0.34565    .01245+00       0
338       13.445    0.92395    .0005+00        0
339       13.445    0.67489    .74361+00       0
337       13.45361  0.20981    .1284+00        1
337.5     13.45361  0.98703    .0098+00        1
338       13.45361  0.54092    .7853+00        1
338.5     13.45361  0.38567    .2311+00        1
Run Code Online (Sandbox Code Playgroud)

我想使用内部联接,因为 list1 的数据帧与 list2 的数据帧的行数不同。

我试着用公认的答案dplyr,从这个问题,但它结束了在一个奇怪的方式将它们合并,我不太清楚发生了什么。看起来它水平合并而不是垂直合并......?

> c(list1, list2) %>%
      Reduce(function(dtf1, dtf2) inner_join(dtf1, dtf2, by="Wvlgth"), .)

  Wvlgth  Global.x group.x Global.y group.y time.x   IRD.x   time.y
1  337.0  .9923+00       0 .1284+00       1 13.445 0.01324 13.45361
2  337.5 .01245+00       0 .0098+00       1 13.445 0.34565 13.45361
3  338.0  .0005+00       0 .7853+00       1 13.445 0.92395 13.45361
4  339.0 .74361+00       0 .1211+00       1 13.445 0.67489 13.45361
    IRD.y
1 0.20981
2 0.98703
3 0.54092
4 0.38567
Run Code Online (Sandbox Code Playgroud)

aos*_*ith 6

您可以同时循环遍历两个列表并使用map2from package purrr连接每个元素。要返回单个 data.frame 而不是单独的、连接的 data.frames 的列表,您可以使用map2_df.

library(purrr)
library(dplyr)

map2_df(list1, list2, inner_join, by = "Wvlgth")

  Wvlgth    Global group     time     IRD
1  337.0  .9923+00     0   13.445 0.01324
2  337.5 .01245+00     0   13.445 0.34565
3  338.0  .0005+00     0   13.445 0.92395
4  339.0 .74361+00     0   13.445 0.67489
5  337.0  .1284+00     1 13.45361 0.20981
6  337.5  .0098+00     1 13.45361 0.98703
7  338.0  .7853+00     1 13.45361 0.54092
8  339.0  .1211+00     1 13.45361 0.38567
Run Code Online (Sandbox Code Playgroud)