为什么在 dplyr 辅助函数“across”中可以检测到 tidyselect 辅助函数“where”?

Mil*_*han 3 r dplyr tidyverse tidyselect

“tidyselect”包提供了一个选择辅助函数wherewhere用于通过自定义函数选择数据框列。它是“tidyselect”的内部函数。这意味着where不会被加载到您的命名空间中,您只能通过tidyselect:::where.

但是,我从 dplyr 插图中看到了以下示例:columnwise Operations

starwars %>% 
  summarise(across(where(is.character), ~ length(unique(.x))))
#> # A tibble: 1 x 8
#>    name hair_color skin_color eye_color   sex gender homeworld species
#>   <int>      <int>      <int>     <int> <int>  <int>     <int>   <int>
#> 1    87         13         31        15     5      3        49      38
Run Code Online (Sandbox Code Playgroud)

在此示例中,where编写时没有前缀“tidyselect:::”,但显然,代码中没有错误,并且它产生了有意义的结果。这对我来说似乎很奇怪。我想知道为什么代码可以正常运行。

我猜这是由于“代码引用”,它是 tidyeval 方法的一部分。粗略地说,代码引用将代码挂起为表达式,并稍后在“内部环境”中计算表达式。这只是一个直观的猜测,我不知道如何测试。

我希望有人可以帮助我解决“哪里”的问题,或者留下一些关于代码如何为我工作的参考。

AEF*_*AEF 5

您没有说明示例中附加了哪些包,但我们假设唯一附加的包是dplyr.

library(dplyr)
Run Code Online (Sandbox Code Playgroud)

首先,我们注意到该函数where未附加,即当前 R 会话不知道该函数。我们只需在控制台中输入其名称(不带括号)即可进行检查。如果附加了该函数,我们现在将看到它的源代码。相反,我们收到一个错误,指出where未找到对象。

然而,我们注意到dplyr附加了来自 的其他函数tidyselect,作为starts_with一个例子。如果我们重复在控制台中输入名称的实验,我们现在可以看到源代码,并且这些函数源自命名空间tidyselect

> starts_with
function (match, ignore.case = TRUE, vars = NULL) 
{
    check_match(match)
    vars <- vars %||% peek_vars(fn = "starts_with")
    if (ignore.case) {
        vars <- tolower(vars)
        match <- tolower(match)
    }
    flat_map_int(match, starts_with_impl, vars)
}
<bytecode: 0x0000027338e5f8e8>
<environment: namespace:tidyselect>
Run Code Online (Sandbox Code Playgroud)

在这种情况下,该函数starts_with是由 dplyr 使用该NAMESPACE文件附加的,您可以在其中列出应与您的包一起附加的其他包中的函数。你可以查看dplyr 源代码

where正如我们已经看到的那样,并没有以这种方式提供。在这种情况下,该函数确实被引用,并且仅在 tidyselect 包中进行评估。如果您查看across 的源代码,您会注意到在第 82 行中,列规范传递给across_setup同一文件中定义的函数。在此函数中,列规范被引用(第 174、175 行),然后发送到函数tidyselecttidyselect::eval_select第 177 行)。该函数是 tidyselect 包的一部分,并且可以访问where.

  • 很好的解释!很高兴知道为什么“where”的处理方式与其他选择帮助程序不同(即不重新导出),但这很可能只能来自开发人员自己。 (2认同)