JMQ*_*JMQ 4 string arguments r function
Dataframechocolates
列出了糖果的类型以及对每种糖果的一组评级:
ID sweetness filling crash
snickers 0.67 0.55 0.40
milky_way 0.81 0.53 0.56
...
Run Code Online (Sandbox Code Playgroud)
我正在编写一个函数,它接受文件名的参数、特定类型糖果的 ID 以及我感兴趣的分数 ( sweetness
, filling
, or crash
) 并返回该文件中某个糖果的某个分数。例如,如果我想要“士力架”的sweetness
评分ID
(如下面的语法)......
> chocolates$sweetness[chocolates$ID=="snickers"]
[1] 0.67
Run Code Online (Sandbox Code Playgroud)
...某些函数candyranks(data=, ID=, score=)
应该返回相同的值。这是我写的:
candyranks <- function(data, id, score){
data$score[chocolates$ID=="snickers"]
}
Run Code Online (Sandbox Code Playgroud)
但candyranks(data=chocolates, ID = "snickers", score = sweetness)
返回值NULL
. 我已经确定ID
是一个字符向量。关于为什么它不会返回值的任何想法0.67
?
这是一个工作示例:
首先让我们定义一个可重现的数据框:
chocolate <- data.frame(ID = c("snickers", "milky_way"),
sweetness = c(0.67, 0.81),
filling = c(0.55, 0.55),
crash = c(0.40, 0.56))
Run Code Online (Sandbox Code Playgroud)
现在我们要确保我们的所有参数不被视为列名,而是对象调用。我们还想在适当的时候使用我们的函数参数来给函数更多的灵活性:
candyranks <- function(data, id, score){
data[[score]][data$ID==id]
}
Run Code Online (Sandbox Code Playgroud)
在这个例子中,它更灵活一些,因为它不需要调用数据集chocolate
。给我们以下内容:
candyranks(data = chocolate, id = "snickers", score = "sweetness")
[1] 0.67
Run Code Online (Sandbox Code Playgroud)
dplyr
方法:虽然 baseR
非常适合这种情况,但我知道有些人更喜欢使用dplyr
语法来逐行查看正在发生的事情。对于此数据集,以下内容应与上述完全相同,但要使用tidyverse
冗长:
candyranks <- function(data, id, score){
require(dplyr)
data %>%
filter(ID == id) %>%
pull(score)
}
Run Code Online (Sandbox Code Playgroud)