如何在dplyr :: mutate_each中使用命名空间函数?

zer*_*323 6 namespaces r dplyr

我试图使用dplyr::mutate_each一些外部函数而不附加实际的库

dplyr::tbl_df(iris) %>% 
    dplyr::mutate_each(dplyr::funs(stringi::stri_trim_both))
Run Code Online (Sandbox Code Playgroud)

但它失败并出现以下错误:

错误:列'Sepal.Length'的类型不受支持(CLOSXP,classes = function)

当我使用data.table而不是data.frame:

`[.data.table`(`_dt` ,,`:=`(Sepal.Length,stringi :: stri_trim_both)中的错误,:赋值的RHS不是NULL,不是原子向量(参见?is.atomic)而不是列表列.

如果我使用如下的局部变量,一切都按预期工作.

trim_both <-  stringi::stri_trim_both
dplyr::tbl_df(iris) %>% dplyr::mutate_each(dplyr::funs(trim_both))
Run Code Online (Sandbox Code Playgroud)

它不是最佳解决方案,但我可以忍受.不过,我很感激解释问题的根源是什么.

会话信息:

R version 3.1.1 (2014-07-10)
Platform: x86_64-pc-linux-gnu (64-bit)

locale:
 [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C              
 [3] LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8    
 [5] LC_MONETARY=en_US.UTF-8    LC_MESSAGES=en_US.UTF-8   
 [7] LC_PAPER=en_US.UTF-8       LC_NAME=C                 
 [9] LC_ADDRESS=C               LC_TELEPHONE=C            
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] dplyr_0.4.1

loaded via a namespace (and not attached):
[1] assertthat_0.1       DBI_0.3.1            lazyeval_0.1.10.9000
[4] magrittr_1.5         parallel_3.1.1       Rcpp_0.11.4         
[7] stringi_0.4-1        tools_3.1.1         
Run Code Online (Sandbox Code Playgroud)

注意:dplyr0.7.2中不再出现此问题.

sha*_*dow 8

根本原因是dplyr::funs_电话dplyr:::make_call.并dplyr:::make_call使用class生成的对象区分使用的对象lazyeval::lazy_dots.

class(lazyeval::lazy_dots(trim_both)[[1]]$expr)
## "name"
class(lazyeval::lazy_dots(stringi::stri_trim_both)[[1]]$expr)
## "call"
Run Code Online (Sandbox Code Playgroud)

请参阅my_funs下面的功能以获得解决方案.我没有对此进行过任何细节测试,我确信这是有不同的原因dplyr,所以不要将它作为默认值.这主要是为了澄清问题

# calling my_funs_ (instead of funs_)
my_funs <- function (...) 
  my_funs_(lazyeval::lazy_dots(...))

my_funs_ <- function(dots){
  dots <- lazyeval::as.lazy_dots(dots)
  env <- lazyeval::common_env(dots)
  names(dots) <- dplyr:::names2(dots)
  # difference here
  dots[] <- lapply(dots, function(x) {
    if (is.character(x$expr)) {
      x$expr <- substitute(f(.), list(f = as.name(x$expr)))
    }
    else if (is.name(x$expr)) {
      x$expr <- substitute(f(.), list(f = x$expr))
    }
    else if (is.call(x$expr)) {
      x$expr <- substitute(f(.), list(f = x$expr)) #### this line was different
      # originally x$expr <- x$expr
    }
    else {
      stop("Unknown inputs")
    }
    x
  })
  missing_names <- names(dots) == ""
  ### this is also different 
  default_names <- vapply(dots[missing_names], function(x) as.character(x)[1], 
                          character(1))
  ## originally dplyr:::make_name(x) instead of as.character(x)[1]
  names(dots)[missing_names] <- default_names
  class(dots) <- c("fun_list", "lazy_dots")
  dots
}

dplyr::tbl_df(iris) %>% 
  dplyr::mutate_each(my_funs(stringi::stri_trim_both))
Run Code Online (Sandbox Code Playgroud)