DR1*_*R15 3 random r normal-distribution gaussian
我正在从多元正态分布生成大量数据用于模拟。我想知道是否有人知道哪个命令对此最有效。如果是 mvrnorm(来自“MASS”包)或 rmvnorm(来自“mvtnorm”包)。
通过对不同的方法进行计时,可以轻松回答此类问题。让
library(microbenchmark)
library(MASS)
library(mvtnorm)
n <- 10000
k <- 50
mu <- rep(0, k)
rho <- 0.2
Sigma <- diag(k) * (1 - rho) + rho
Run Code Online (Sandbox Code Playgroud)
通过这种方式,我们有 50 个变量,单位方差和相关性为 0.2。生成我们得到的 10000 个观察值
microbenchmark(mvrnorm(n, mu = mu, Sigma = Sigma),
rmvnorm(n, mean = mu, sigma = Sigma, method = "eigen"),
rmvnorm(n, mean = mu, sigma = Sigma, method = "svd"),
rmvnorm(n, mean = mu, sigma = Sigma, method = "chol"),
times = 100)
# Unit: milliseconds
# expr min lq mean median uq max neval cld
# mvrnorm(n, mu = mu, Sigma = Sigma) 65.04667 73.02912 85.30384 81.70611 92.69137 148.6959 100 a
# rmvnorm(n, mean = mu, sigma = Sigma, method = "eigen") 71.14170 81.08311 95.12891 88.84669 100.62174 237.0012 100 b
# rmvnorm(n, mean = mu, sigma = Sigma, method = "svd") 71.32999 81.30640 93.40939 88.54804 104.00281 208.3690 100 b
# rmvnorm(n, mean = mu, sigma = Sigma, method = "chol") 71.22712 78.59898 94.13958 89.04653 108.27363 158.7890 100 b
Run Code Online (Sandbox Code Playgroud)
因此,性能可能mvrnorm稍好一些。当你心里有一个特定的应用程序,你应该设置n,k以及Sigma对价值观更胜任这项申请。
由于您似乎不受这两种方法的限制,因此您可以寻找Rcpp替代方法;参见,例如,1、2、3。