将函数应用于数据框

tkr*_*rex 0 r plyr

我无法弄清楚为什么这不起作用.我有一个包含5列n行的数据集.我只想对每一行应用一个函数,并以n×1向量返回结果.

为了测试一切是如何工作的,我做了这个简单的功能:

f1 <- function(uniqueid,Perspvalue,expvalue,stddevi,stddevc) {
    uniqueid+ Perspvalue- expvalue+ stddevi+stddevc
}
Run Code Online (Sandbox Code Playgroud)

这是我的数据集的前几行:

> data
     uniqueid   Perspvalue    expvalue      stddevi      stddevc
1           1 2.404421e+03  3337239.00 8.266566e+03 3.324624e+03
2           2 1.345307e+03  3276559.87 7.068823e+03 2.648072e+03
3           3 1.345307e+03  3276559.87 7.068823e+03 2.648072e+03
Run Code Online (Sandbox Code Playgroud)

请注意,它是一个数据框(我认为),而不是矩阵.我使用read.csv从csv加载数据.

所以我试试这个: apply(data,1,f1)

但我的结果是这样的: Error in uniqueid + Perspvalue : 'Perspvalue' is missing

我期待一个数字而不是错误.

Pau*_*tra 7

你需要使用mapply这个,或者更方便mdply的plyr包.

一些示例代码:

spam_function = function(a, b) {
  return(a*b)
}

require(plyr)
input_args = data.frame(a = runif(1000), b = runif(1000))
result = mdply(input_args, spam_function)
> head(result)
           a         b         V1
1 0.46902575 0.6865863 0.32202668
2 0.56837805 0.2400993 0.13646717
3 0.07185661 0.2334754 0.01677675
4 0.15589191 0.6636891 0.10346377
5 0.98317092 0.8895609 0.87459042
6 0.46070479 0.4301685 0.19818071
Run Code Online (Sandbox Code Playgroud)

如果你只想要结果向量:

result_vector = result$V1
Run Code Online (Sandbox Code Playgroud)

或者,基础R解决方案使用mapply:

result_mapply = mapply(spam_function, a = input_args$a, b = input_args$b)
> head(result_mapply)
[1] 0.2757767 0.1268879 0.5851026 0.7904186
[5] 0.2186079 0.1091692
Run Code Online (Sandbox Code Playgroud)