Mil*_*han 3 r dplyr tidyverse tidyselect
“tidyselect”包提供了一个选择辅助函数where。where用于通过自定义函数选择数据框列。它是“tidyselect”的内部函数。这意味着where不会被加载到您的命名空间中,您只能通过tidyselect:::where.
但是,我从 dplyr 插图中看到了以下示例:columnwise Operations。
starwars %>%
summarise(across(where(is.character), ~ length(unique(.x))))
#> # A tibble: 1 x 8
#> name hair_color skin_color eye_color sex gender homeworld species
#> <int> <int> <int> <int> <int> <int> <int> <int>
#> 1 87 13 31 15 5 3 49 38
Run Code Online (Sandbox Code Playgroud)
在此示例中,where编写时没有前缀“tidyselect:::”,但显然,代码中没有错误,并且它产生了有意义的结果。这对我来说似乎很奇怪。我想知道为什么代码可以正常运行。
我猜这是由于“代码引用”,它是 tidyeval 方法的一部分。粗略地说,代码引用将代码挂起为表达式,并稍后在“内部环境”中计算表达式。这只是一个直观的猜测,我不知道如何测试。
我希望有人可以帮助我解决“哪里”的问题,或者留下一些关于代码如何为我工作的参考。
您没有说明示例中附加了哪些包,但我们假设唯一附加的包是dplyr.
library(dplyr)
Run Code Online (Sandbox Code Playgroud)
首先,我们注意到该函数where未附加,即当前 R 会话不知道该函数。我们只需在控制台中输入其名称(不带括号)即可进行检查。如果附加了该函数,我们现在将看到它的源代码。相反,我们收到一个错误,指出where未找到对象。
然而,我们注意到dplyr附加了来自 的其他函数tidyselect,作为starts_with一个例子。如果我们重复在控制台中输入名称的实验,我们现在可以看到源代码,并且这些函数源自命名空间tidyselect:
> starts_with
function (match, ignore.case = TRUE, vars = NULL)
{
check_match(match)
vars <- vars %||% peek_vars(fn = "starts_with")
if (ignore.case) {
vars <- tolower(vars)
match <- tolower(match)
}
flat_map_int(match, starts_with_impl, vars)
}
<bytecode: 0x0000027338e5f8e8>
<environment: namespace:tidyselect>
Run Code Online (Sandbox Code Playgroud)
在这种情况下,该函数starts_with是由 dplyr 使用该NAMESPACE文件附加的,您可以在其中列出应与您的包一起附加的其他包中的函数。你可以查看dplyr 源代码。
但where正如我们已经看到的那样,并没有以这种方式提供。在这种情况下,该函数确实被引用,并且仅在 tidyselect 包中进行评估。如果您查看across 的源代码,您会注意到在第 82 行中,列规范传递给across_setup同一文件中定义的函数。在此函数中,列规范被引用(第 174、175 行),然后发送到函数tidyselect(tidyselect::eval_select第 177 行)。该函数是 tidyselect 包的一部分,并且可以访问where.
| 归档时间: |
|
| 查看次数: |
367 次 |
| 最近记录: |