在 R 中使用波浪号 (~) 和句号 (.)

Kev*_*Lee 3 for-loop r r-formula

我正在使用 Hadley 的 R4DS 书使用 tidyverse 和 purrr 进行循环,并且对波浪号 ~ 符号和句点符号的确切用法感到有些困惑。

因此,在编写 for 循环或使用 map() 时,您可以使用波浪号代替 ~,而不是写出 function()。

这仅适用于 for 循环吗?

所以如下...

models <- mtcars %>% 
  split(.$cyl) %>% 
  map(~lm(mpg ~ wt, data = .))
Run Code Online (Sandbox Code Playgroud)

此外,我被告知的句点可用于“引用当前列表元素”。但我很困惑这意味着什么。这是否意味着,只有在循环时,句点才表示它指的是正在循环的列表中的元素?它与管道有什么不同?当您使用管道时,您将一行的结果通过管道传输到下一行代码。

所以在上面的例子中, mtcars 是用 split() 管道传输到第二行的,但使用了一个句点。为什么?

下面的案例总结了我的困惑:

x <- c(1:10)

detect(x, ~.x > 5)
Run Code Online (Sandbox Code Playgroud)

使用检测功能,找到第一个匹配,我想我可以使用

detect(x, x >5)
Run Code Online (Sandbox Code Playgroud)

但我收到一条错误消息,说 x >5 不是函数。所以我加了一个波浪号

detect(x, ~ x > 5)
Run Code Online (Sandbox Code Playgroud)

并得到一个错误说它期望一个 TRUE 或 FALSE,而不是 10。所以如果你添加一个句点

detect(x, ~.x >5) 
Run Code Online (Sandbox Code Playgroud)

突然它可以作为循环使用。那么 ~ 和 . 这里又如何。与简单的管道相比?

Ian*_*ell 6

这种整体被称为tidyverse非标准评估 (NSE)。您可能发现它~用于公式中以表示左侧依赖于右侧。

tidyverseNSE 中,~表示function(...)。因此,这两个表达式是等价的。

x %>% detect(function(...) ..1 > 5)
#[1] 6

x %>% detect(~.x > 5)
#[1] 6
Run Code Online (Sandbox Code Playgroud)

~自动将函数的每个参数分配给.; .x, .y; 和..1..2 ..3特殊符号。请注意,只有第一个参数变为.

map2(1, 2, function(x,y) x + y)
#[[1]]
#[1] 3

map2(1, 2, ~.x + .y)
#[[1]]
#[1] 3

map2(1, 2, ~..1 + ..2)
#[[1]]
#[1] 3

map2(1, 2, ~. + ..2)
#[[1]]
#[1] 3

map2(1, 2, ~. + .[2])
#[[1]]
#[1] NA
Run Code Online (Sandbox Code Playgroud)

当有很多变量时,这种自动分配非常有用。

mtcars %>% pmap_dbl(~ ..1/..4)
# [1] 0.19090909 0.19090909 0.24516129 0.19454545 0.10685714 0.17238095 0.05836735 0.39354839 0.24000000 0.15609756
#[11] 0.14471545 0.09111111 0.09611111 0.08444444 0.05073171 0.04837209 0.06391304 0.49090909 0.58461538 0.52153846
#[21] 0.22164948 0.10333333 0.10133333 0.05428571 0.10971429 0.41363636 0.28571429 0.26902655 0.05984848 0.11257143
#[31] 0.04477612 0.19633028
Run Code Online (Sandbox Code Playgroud)

但是除了我上面提到的所有特殊符号之外,参数也分配给.... 就像所有的 R 一样,...有点像一个命名的参数列表,所以你可以将它与with

mtcars %>% pmap_dbl(~ with(list(...), mpg/hp))
# [1] 0.19090909 0.19090909 0.24516129 0.19454545 0.10685714 0.17238095 0.05836735 0.39354839 0.24000000 0.15609756
#[11] 0.14471545 0.09111111 0.09611111 0.08444444 0.05073171 0.04837209 0.06391304 0.49090909 0.58461538 0.52153846
#[21] 0.22164948 0.10333333 0.10133333 0.05428571 0.10971429 0.41363636 0.28571429 0.26902655 0.05984848 0.11257143
#[31] 0.04477612 0.19633028
Run Code Online (Sandbox Code Playgroud)

另一种思考为什么会起作用的方法是因为data.frames 只是list带有一些行名称的 a :

a <- list(a = c(1,2), b = c("A","B"))
a
#$a
#[1] 1 2
#$b
#[1] "A" "B"
attr(a,"row.names") <- as.character(c(1,2))
class(a) <- "data.frame"
a
#  a b
#1 1 A
#2 2 B
Run Code Online (Sandbox Code Playgroud)