如何打印 purrr::map 在 R 中作用的数据帧行

Dav*_*ger 3 for-loop r purrr tidyverse

我正在使用purrr::map在长数据框列表列上运行耗时的函数,并且我想打印正在执行的行的指示器,以便我可以跟踪进度。

这是一个小例子:

当我运行这个:

library(dplyr)
library(tidyr)
library(purrr)
mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = map(data, nrow))
Run Code Online (Sandbox Code Playgroud)

我想输出carb正在执行的行的:

#> 4
#> 1
#> 2
#> 3
#> 6
#> 8
Run Code Online (Sandbox Code Playgroud)

您可以通过使用这样的for循环来获得:

df <-
    mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = NA)
for (i in 1:nrow(df)) {
    print(df$carb[i])
    df$n[i] <- list(nrow(df$data[[i]]))
}
Run Code Online (Sandbox Code Playgroud)

aos*_*ith 5

您可以carbdata使用map2(). 然后你可以print()在你的函数中添加一条语句来输出carb.

dat = mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = map2(data, carb, ~{
        print(.y)
        nrow(.x)
        }) 
        )

[1] 4
[1] 1
[1] 2
[1] 3
[1] 6
[1] 8

dat
# A tibble: 6 x 3
   carb data               n        
  <dbl> <list>             <list>   
1     4 <tibble [10 x 11]> <int [1]>
2     1 <tibble [7 x 11]>  <int [1]>
3     2 <tibble [10 x 11]> <int [1]>
4     3 <tibble [3 x 11]>  <int [1]>
5     6 <tibble [1 x 11]>  <int [1]>
6     8 <tibble [1 x 11]>  <int [1]>
Run Code Online (Sandbox Code Playgroud)

为方便起见,我使用了公式语法,其中.x指的是第一个向量 inmap2().y第二个向量。如果更清楚,您可以执行匿名函数。(我不确定我是否喜欢带有波浪号的括号。)

mtcars %>% 
    group_by(carb) %>% 
    nest() %>% 
    mutate(n = map2(data, carb, function(x, y) {
        print(y)
        nrow(x)
        })
        )
Run Code Online (Sandbox Code Playgroud)