在R中,如何找到最佳变量以最大化或最小化两个数据集之间的相关性

elf*_*fty 1 excel optimization r correlation

我能够在Excel中轻松完成此操作,但我的数据集太大了.在excel中,我会使用求解器.

Column A,B = random numbers
Column C = random number (which I want to maximize the correlation to)
Column D = A*x+B*y where x,y are coefficients resulted from solver
Run Code Online (Sandbox Code Playgroud)

在一个单独的单元格中,我会有相关的(C,D)

在求解器中,我将correl(C,D)的目标设置为max,通过改变变量x,y并设置某些约束(例如x,y都必须是正数).

我怎么能在R中这样做?谢谢您的帮助.

tim*_*ffe 9

在R中,您创建一个function,其输出是您想要最大化或最小化的值.基本R中包含的一个优化器称为optim():

    set.seed(1)
    A <- runif(100)
    B <- runif(100)
    C <- runif(100)

    # these are your x and y to optimize
    pars <- c(x=1,y=1)

    OptPars <- function(pars,A,B,C){
        D <- A*pars[1]+B*pars[2]
        -cor(C,D)
    }
    # optim is one of many R-ish ways to do Excel's solver
    # it minimizes by default (though you can tell it not to)
    # and that's why I told it to take -cor()
    optim(pars,OptPars,A=A,B=B,C=C)
Run Code Online (Sandbox Code Playgroud)

如果您想要xy拥有约束,请在您正在优化的函数中包含该约束,例如,abs(x)而不是x.