字符串作为R中的函数参数

JMQ*_*JMQ 4 string arguments r function

Dataframechocolates列出了糖果的类型以及对每种糖果的一组评级:

ID          sweetness   filling   crash
snickers    0.67        0.55      0.40
milky_way   0.81        0.53      0.56
...
Run Code Online (Sandbox Code Playgroud)

我正在编写一个函数,它接受文件名的参数、特定类型糖果的 ID 以及我感兴趣的分数 ( sweetness, filling, or crash) 并返回该文件中某个糖果的某个分数。例如,如果我想要“士力架”的sweetness评分ID(如下面的语法)......

> chocolates$sweetness[chocolates$ID=="snickers"]
[1] 0.67
Run Code Online (Sandbox Code Playgroud)

...某些函数candyranks(data=, ID=, score=)应该返回相同的值。这是我写的:

candyranks <- function(data, id, score){
  data$score[chocolates$ID=="snickers"]
}
Run Code Online (Sandbox Code Playgroud)

candyranks(data=chocolates, ID = "snickers", score = sweetness)返回值NULL. 我已经确定ID是一个字符向量。关于为什么它不会返回值的任何想法0.67

Dav*_*ald 6

这是一个工作示例:

首先让我们定义一个可重现的数据框:

chocolate <- data.frame(ID = c("snickers", "milky_way"),
                        sweetness = c(0.67, 0.81),
                        filling = c(0.55, 0.55),
                        crash = c(0.40, 0.56))
Run Code Online (Sandbox Code Playgroud)

现在我们要确保我们的所有参数不被视为列名,而是对象调用。我们还想在适当的时候使用我们的函数参数来给函数更多的灵活性:

candyranks <- function(data, id, score){
  data[[score]][data$ID==id]
}
Run Code Online (Sandbox Code Playgroud)

在这个例子中,它更灵活一些,因为它不需要调用数据集chocolate。给我们以下内容:

candyranks(data = chocolate, id = "snickers", score = "sweetness")
[1] 0.67
Run Code Online (Sandbox Code Playgroud)

替代dplyr方法:

虽然 baseR非常适合这种情况,但我知道有些人更喜欢使用dplyr语法来逐行查看正在发生的事情。对于此数据集,以下内容与上述完全相同,但要使用tidyverse冗长:

candyranks <- function(data, id, score){
  require(dplyr)
  data %>% 
    filter(ID == id) %>% 
    pull(score)
}
Run Code Online (Sandbox Code Playgroud)