Xia*_*Zhu 5 r matrix bayesian stan brms
我正在尝试将矩阵数据输入到brm()函数中以运行信号回归。brm来自 brms 包,它提供了一个使用 Stan 拟合贝叶斯模型的接口。信号回归是指在更大的模型中使用另一个协变量对一个协变量进行建模,并使用by如下参数:model <- brm(response ~ s(matrix1, by = matrix2) + ..., data = Data)。问题是,我无法使用“data”参数输入矩阵,因为它只允许data.frame输入一个对象。
这是我的代码以及我试图绕过该约束而获得的错误......
首先,我的可重现代码导致模型构建:
library(brms)
#100 rows, 4 columns. Each cell contains a number between 1 and 10
Data <- data.frame(runif(100,1,10),runif(100,1,10),runif(100,1,10),runif(100,1,10))
#Assign names to the columns
names(Data) <- c("d0_10","d0_100","d0_1000","d0_10000")
Data$Density <- as.matrix(Data)%*%c(-1,10,5,1)
#the coefficients we are modelling
d <- c(-1,10,5,1)
#Made a matrix with 4 columns with values 10, 100, 1000, 10000 which are evaluation points. Rows are repeats of the same column numbers
Bins <- 10^matrix(rep(1:4,times = dim(Data)[1]),ncol = 4,byrow =T)
Bins
Run Code Online (Sandbox Code Playgroud)
如上所述,由于“data”只允许输入一个 data.frame 对象,因此我尝试了其他输入矩阵数据的方法。这些方法包括:
1)使用 as.matrix() 在 brm() 函数中制作矩阵
signalregression.brms <- brm(Density ~ s(Bins,by=as.matrix(Data[,c(c("d0_10","d0_100","d0_1000","d0_10000"))])),data = Data)
#Error in is(sexpr, "try-error") :
argument "sexpr" is missing, with no default
Run Code Online (Sandbox Code Playgroud)
2)在公式之外创建矩阵,将其存储在变量中,然后在brm()函数内调用该变量
Donuts <- as.matrix(Data[,c(c("d0_10","d0_100","d0_1000","d0_10000"))])
signalregression.brms <- brm(Density ~ s(Bins,by=Donuts),data = Data)
#Error: The following variables can neither be found in 'data' nor in 'data2':
'Bins', 'Donuts'
Run Code Online (Sandbox Code Playgroud)
3)使用“data2”参数输入包含矩阵的列表
signalregression.brms <- brm(Density ~ s(Bins,by=donuts),data = Data,data2=list(Bins = 10^matrix(rep(1:4,times = dim(Data)[1]),ncol = 4,byrow =T),donuts=as.matrix(Data[,c(c("d0_10","d0_100","d0_1000","d0_10000"))])))
#Error in names(dat) <- object$term :
'names' attribute [1] must be the same length as the vector [0]
Run Code Online (Sandbox Code Playgroud)
以上均无效;每个都有自己的错误,并且很难对其进行故障排除,因为我无法在网上找到与 brms 背景下具有相似性质的答案或示例。
我能够在 mgcv 包中将上述技术很好地用于 gam() - 您不必使用“data”定义 data.frame,您可以调用在 gam() 公式之外定义的变量,您可以在 gam() 函数本身内部创建矩阵。见下文:
library(mgcv)
signalregression2 <- gam(Data$Density ~ s(Bins,by = as.matrix(Data[,c("d0_10","d0_100","d0_1000","d0_10000")]),k=3))
#Works!
Run Code Online (Sandbox Code Playgroud)
看来 brms 不太灵活......:(
我的问题:有人对如何运行我的 brm() 函数有任何建议吗?
非常感谢!
我对信号回归的理解非常有限,我不相信这是正确的,但我认为这至少是朝着正确方向迈出的一步。问题似乎是brm()期望其公式中的所有内容都是 中的一列data。因此,我们可以通过确保我们想要的所有内容都存在来编译模型data:
library(tidyverse)
signalregression.brms = brm(Density ~
s(cbind(d0_10_bin, d0_100_bin, d0_1000_bin, d0_10000_bin),
by = cbind(d0_10, d0_100, d0_1000, d0_10000),
k = 3),
data = Data %>%
mutate(d0_10_bin = 10,
d0_100_bin = 100,
d0_1000_bin = 1000,
d0_10000_bin = 10000))
Run Code Online (Sandbox Code Playgroud)
手写每一栏有点烦人;我确信有更通用的解决方案。
作为参考,以下是我安装的软件包版本:
map_chr(unname(unlist(pacman::p_depends(brms)[c("Depends", "Imports")])), ~ paste(., ": ", pacman::p_version(.), sep = ""))
[1] "Rcpp: 1.0.6" "methods: 4.0.3" "rstan: 2.21.2" "ggplot2: 3.3.3"
[5] "loo: 2.4.1" "Matrix: 1.2.18" "mgcv: 1.8.33" "rstantools: 2.1.1"
[9] "bayesplot: 1.8.0" "shinystan: 2.5.0" "projpred: 2.0.2" "bridgesampling: 1.1.2"
[13] "glue: 1.4.2" "future: 1.21.0" "matrixStats: 0.58.0" "nleqslv: 3.3.2"
[17] "nlme: 3.1.149" "coda: 0.19.4" "abind: 1.4.5" "stats: 4.0.3"
[21] "utils: 4.0.3" "parallel: 4.0.3" "grDevices: 4.0.3" "backports: 1.2.1"
Run Code Online (Sandbox Code Playgroud)