mutate()在使用美元符号运算符时尝试使用全局变量的值进行提取

Cam*_*nek 13 r dplyr

当全局环境中的变量恰好mutate$提取的元素同名时,我使用提取得到了有趣的结果.(我正在运行R 3.1.3和dplyr 0.4.3.9.)这很好用:

library(dplyr)

df <- data.frame(time = 1:5, val = c(2.3, 3.9, NA, 8.1, 9.6))

mutate(df, val = approx(time, val, time)$y)
#   time val
# 1    1 2.3
# 2    2 3.9
# 3    3 6.0
# 4    4 8.1
# 5    5 9.6
Run Code Online (Sandbox Code Playgroud)

但是,如果我定义一个全局变量y,有趣的事情会发生:

y <- 1L
mutate(df, val = approx(time, val, time)$y)
# Error: invalid subscript type 'integer'
Run Code Online (Sandbox Code Playgroud)

请注意,使用带有字符串参数的双括号仍然按预期工作:

mutate(df, val = approx(time, val, time)[['y']])
#   time val
# 1    1 2.3
# 2    2 3.9
# 3    3 6.0
# 4    4 8.1
# 5    5 9.6
Run Code Online (Sandbox Code Playgroud)

有趣的是,如果y是一个字符,我们会得到不同类型的错误:

y <- 'a'
mutate(df, val = approx(time, val, time)$y)
# Error: unsupported type for column 'val' (NILSXP, classes = NULL)
Run Code Online (Sandbox Code Playgroud)

最后,为了完整性,这里有一个例子,证明这绝对不是列表提取的常用行为:

l <- list(y = 1:4)
y <- 'a'
l$y
# [1] 1 2 3 4
Run Code Online (Sandbox Code Playgroud)

有谁知道我们为什么会在里面得到这种奇怪的行为mutate?有没有一种简单的方法来解决这个问题,除了使用双括号进行提取或确保搜索路径上没有冲突的变量?

顺便说一句,看起来以下帖子中的OP可能有同样的问题,但没有完全意识到: dplyr mutate失败了命名向量?

Nel*_*son 3

正如@clbieganek 指出的,这是一个错误。尚未修复(从 dplyr 版本 4.3 开始)

评论中建议的可能修复:

$'y'

这是跟踪这个一般问题的问题: https ://github.com/hadley/dplyr/issues/1400