当全局环境中的变量恰好mutate与$提取的元素同名时,我使用提取得到了有趣的结果.(我正在运行R 3.1.3和dplyr 0.4.3.9.)这很好用:
library(dplyr)
df <- data.frame(time = 1:5, val = c(2.3, 3.9, NA, 8.1, 9.6))
mutate(df, val = approx(time, val, time)$y)
# time val
# 1 1 2.3
# 2 2 3.9
# 3 3 6.0
# 4 4 8.1
# 5 5 9.6
Run Code Online (Sandbox Code Playgroud)
但是,如果我定义一个全局变量y,有趣的事情会发生:
y <- 1L
mutate(df, val = approx(time, val, time)$y)
# Error: invalid subscript type 'integer'
Run Code Online (Sandbox Code Playgroud)
请注意,使用带有字符串参数的双括号仍然按预期工作:
mutate(df, val = approx(time, val, time)[['y']])
# time val
# 1 1 2.3
# 2 2 3.9
# 3 3 6.0
# 4 4 8.1
# 5 5 9.6
Run Code Online (Sandbox Code Playgroud)
有趣的是,如果y是一个字符,我们会得到不同类型的错误:
y <- 'a'
mutate(df, val = approx(time, val, time)$y)
# Error: unsupported type for column 'val' (NILSXP, classes = NULL)
Run Code Online (Sandbox Code Playgroud)
最后,为了完整性,这里有一个例子,证明这绝对不是列表提取的常用行为:
l <- list(y = 1:4)
y <- 'a'
l$y
# [1] 1 2 3 4
Run Code Online (Sandbox Code Playgroud)
有谁知道我们为什么会在里面得到这种奇怪的行为mutate?有没有一种简单的方法来解决这个问题,除了使用双括号进行提取或确保搜索路径上没有冲突的变量?
顺便说一句,看起来以下帖子中的OP可能有同样的问题,但没有完全意识到: dplyr mutate失败了命名向量?
正如@clbieganek 指出的,这是一个错误。尚未修复(从 dplyr 版本 4.3 开始)
评论中建议的可能修复:
$'y'
这是跟踪这个一般问题的问题: https ://github.com/hadley/dplyr/issues/1400