许多讨论R的非标准评价,功能例如with,subset和transform含有这样的警告:
对于交互式使用,这是非常有效且易于阅读的。然而,对于编程,即在一个函数中,需要更加小心,通常应该避免使用
with(),因为例如,数据中的变量可能会意外覆盖局部变量,请参阅参考资料。
(引用自 的文档with,其他内容的信息量较少)
“参考”是这篇 2003 年的文章。坦率地说,我没有看到它的相关性。它在第 6 节中提到了关于“数据中的变量可能会意外覆盖局部变量”这一点,但它只是这样做 - 提及它。据我所知,该文章中没有任何内容告诉您警告告诉您检查参考资料尚未告诉您的任何内容。
我已经搜索了 R 手册,甚至在 3500 页的参考索引中搜索了术语“非标准”,但除了我已经提到的内容之外,我什么也没想到。我真的认为它会在语言定义中,但我已经阅读了整篇文章并没有找到它。我得到的最接近的是涵盖substitutefunction的部分,我碰巧知道许多具有非标准评估的函数都依赖于此。
至于我确信找不到帮助的任何其他地方,我已经从头到尾阅读了 R 常见问题解答和R 简介。将R常见问题提到eval和substitute时代屈指可数,但不以任何方式与此有关。唯一值得注意的部分是here,它也建议检查 的文档deriv,但我发现那里没有任何用处。
那么,R 是否有任何官方部分实际上记录了非标准评估的危险?我觉得很奇怪,R 的部分文档会告诉我要小心处理某些事情,而没有提供任何告诉我如何去做的地方。不可否认,需要照顾。例如,高级 R 显示了具有非标准评估的函数可能导致问题的几种方式。我之前已经为这种粗心付出了代价,不难找到带有关于非标准评估警告的评论的优秀答案。
我正在构建一个闪亮的应用程序,需要允许用户定义用于绘图的新变量.具体来说,我想允许用户定义一个在mutate动词中使用的表达式.服务器接收表达式作为文本,我想知道如何使mutate在dplyr 0.7中执行它.我可以使用mutate_使其工作(部分),但现在已弃用.它还将新列名称定义为整个表达式而不是新变量
这是一个可重复的例子:
input_from_shiny <- "Petal.ratio = Petal.Length/Petal.Width"
iris_mutated <- iris %>% mutate_(input_from_shiny)
Run Code Online (Sandbox Code Playgroud)
这给出了以下内容
> head(iris_mutated)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species Petal.ratio = Petal.Length/Petal.Width
1 5.1 3.5 1.4 0.2 setosa 7.00
2 4.9 3.0 1.4 0.2 setosa 7.00
3 4.7 3.2 1.3 0.2 setosa 6.50
4 4.6 3.1 1.5 0.2 setosa 7.50
5 5.0 3.6 1.4 0.2 setosa 7.00
6 5.4 3.9 1.7 0.4 setosa 4.25
Run Code Online (Sandbox Code Playgroud)
从技术上讲,我可以使用正则表达式从字符串中提取新的变量名并相应地重命名新列,但我想知道使用最新的dplyr版本实现它的正确方法是什么(正在阅读https://cran.r-project .org/web/packages/dplyr/vignettes/programming.html,但无法弄清楚)
我正在尝试搜索数据库,然后"derived_name"在下面的可重现示例中使用从原始搜索派生的名称标记输出.我正在使用dplyr管道%>%,我在准静态评估和/或非标准评估方面遇到了麻烦.具体而言,使用在最终函数中count_colname派生自的字符对象无法对数据帧进行子集化."derived_name"top_n()
search_name <- "derived_name"
set.seed(1)
letrs <- letters[rnorm(52, 13.5, 5)]
letrs_count.df <- letrs %>%
table() %>%
as.data.frame()
count_colname <- paste0(search_name, "_letr_count")
colnames(letrs_count.df) <- c("letr", count_colname)
letrs_top.df <- letrs_count.df %>%
top_n(5, count_colname)
identical(letrs_top.df, letrs_count.df)
# [1] TRUE
Run Code Online (Sandbox Code Playgroud)
根据这个讨论,我认为上面的代码可行.而这篇文章引起我去尝试top_n_(),这似乎不存在.
我正在学习vignette("programming")哪个有点过头了.这篇文章让我尝试了!! sym()语法,这有效,但我不明白为什么!帮助理解为什么下面的代码工作将非常感激.谢谢.
colnames(letrs_count.df) <- c("letr", count_colname)
letrs_top.df <- letrs_count.df %>%
top_n(5, (!! sym(count_colname)))
letrs_top.df
# letr derived_name_letr_count
# 1 l 5 …Run Code Online (Sandbox Code Playgroud)