将矩阵列与R中的向量元素相乘的最快方法

ros*_*ose 37 r

我有一个矩阵m和一个向量v.我想将第一列矩阵乘以m向量的第一个元素v,并将第二列矩阵乘以向量的第二m个元素v,依此类推.我可以使用以下代码完成它,但我正在寻找一种不需要两个转置调用的方法.我怎样才能在R中更快地做到这一点?

m <- matrix(rnorm(120000), ncol=6)
v <- c(1.5, 3.5, 4.5, 5.5, 6.5, 7.5)

system.time(t(t(m) * v))

#   user  system elapsed 
#   0.02    0.00    0.02 
Run Code Online (Sandbox Code Playgroud)

mne*_*nel 40

使用一些线性代数并执行矩阵乘法,这是非常快的R.

例如

m %*% diag(v)

一些基准测试

m = matrix(rnorm(1200000), ncol=6)

 v=c(1.5, 3.5, 4.5, 5.5, 6.5, 7.5)
library(microbenchmark)
microbenchmark(m %*% diag(v), t(t(m) * v))
##    Unit: milliseconds
##            expr      min       lq   median       uq      max neval
##   m %*% diag(v) 16.57174 16.78104 16.86427 23.13121 109.9006   100
##     t(t(m) * v) 26.21470 26.59049 32.40829 35.38097 122.9351   100
Run Code Online (Sandbox Code Playgroud)

  • 我发现结果很大程度上取决于`v`的长度.对于较短的`v`,`diag()`选项更快,但最终双转置获胜. (3认同)

小智 21

如果列数较多,则t(t(m)*v)解决方案的性能优于矩阵乘法解决方案.但是,有一个更快的解决方案,但它在内存使用方面的成本很高.使用rep()和乘法元素创建一个大到m的矩阵.这是比较,修改mnel的例子:

m = matrix(rnorm(1200000), ncol=600)
v = rep(c(1.5, 3.5, 4.5, 5.5, 6.5, 7.5), length = ncol(m))
library(microbenchmark)

microbenchmark(t(t(m) * v), 
  m %*% diag(v),
  m * rep(v, rep.int(nrow(m),length(v))), 
  m * rep(v, rep(nrow(m),length(v))), 
  m * rep(v, each = nrow(m)))

# Unit: milliseconds
#                                   expr        min         lq       mean     median         uq       max neval
#                            t(t(m) * v)  17.682257  18.807218  20.574513  19.239350  19.818331  62.63947   100
#                          m %*% diag(v) 415.573110 417.835574 421.226179 419.061019 420.601778 465.43276   100
#  m * rep(v, rep.int(nrow(m), ncol(m)))   2.597411   2.794915   5.947318   3.276216   3.873842  48.95579   100
#      m * rep(v, rep(nrow(m), ncol(m)))   2.601701   2.785839   3.707153   2.918994   3.855361  47.48697   100
#             m * rep(v, each = nrow(m))  21.766636  21.901935  23.791504  22.351227  23.049006  66.68491   100
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,在rep()中使用"each"可以为了清晰起见而牺牲速度.rep.int和rep之间的区别似乎可以忽略不计,两种实现都在重复运行microbenchmark()时交换位置.请记住,ncol(m)== length(v).

自动绘制

  • 注意,两次转置也至少复制了一次矩阵,不确定内存使用情况是否比仅扩展矩阵好得多。扩展本身可以使用`matrix(v,nrow = nrow(m), ncol = ncol(m),byrow = TRUE)`。 (2认同)