R,从高维数组中选择子矩阵序列

lio*_*nup 5 r vectorization multidimensional-array

A是具有暗淡100*100*100*100的4维阵列.我想从A的最后两个维度中选择10000个子矩阵.B和C是长度为10000的向量.它们是选择标准.B指定A的行号,C指定列号.

A <- array(rnorm(100^4), dim=c(100,100,100,100))
B <- sample( nrow(A) , 10000 , repl = TRUE )
C <- sample( ncol(A) , 10000 , repl = TRUE )
D <- array(0, dim=c(10000,100,100))
Run Code Online (Sandbox Code Playgroud)

使用for循环:

system.time(
 for ( i in 1:10000 ){    
     D[i,,] <- A[B[i],C[i],,]
 }) 

user  system elapsed 
10.20    0.14   10.34
Run Code Online (Sandbox Code Playgroud)

与mapply:

sub_array <- function(b,c) return(A[b,c,,])
system.time(D <- mapply(FUN = sub_array, B, C, SIMPLIFY='array'))

user  system elapsed 
9.77    3.75   29.17 
Run Code Online (Sandbox Code Playgroud)

这甚至更慢.有更快的方法吗?谢谢.

flo*_*del 2

诀窍是重新调暗A为 3D 数组,以便您可以使用我们所谓的“正常”索引。

一些示例数据:

n <- 60
A <- array(rnorm(n^4), dim=c(n,n,n,n))
B <- sample( nrow(A) , n^2 , repl = TRUE )
C <- sample( ncol(A) , n^2 , repl = TRUE )
D <- array(0, dim=c(n^2,n,n))
Run Code Online (Sandbox Code Playgroud)

OP的方法:

system.time({
  D <- array(0, dim=c(n*n, n, n))
  for ( i in 1:(n*n) ) D[i,,] <- A[B[i],C[i],,]
}) 
#    user  system elapsed 
#    2.33    0.08    2.41 
Run Code Online (Sandbox Code Playgroud)

建议的解决方案:

system.time({
  d <- dim(A)
  dim(A) <- c(prod(d[1:2]), d[3:4])
  D2 <- A[B + d[1]*(C-1),,]
})
#    user  system elapsed 
#    0.37    0.06    0.44 
Run Code Online (Sandbox Code Playgroud)

我们检查结果是否相同:

identical(D, D2)
# [1] TRUE
Run Code Online (Sandbox Code Playgroud)