标签: vectorization

s = 15000;
tic
% for-loop version
H = zeros(s,s);
for c = 1:s
    for r = 1:s
        H(r,c) = 1/(r+c-1);
    end
end
toc
%Elapsed time is 1.359625 seconds.... For-loop 

tic;
% vectorized version
c = 1:s;
r = c';
HH=1./(r+c-1);
toc
%Elapsed time is 0.047916 seconds.... Vectorized

isequal(H,HH)

Run Code Online (Sandbox Code Playgroud)

矢量化代码段比纯 for 循环代码段快 25 倍以上。虽然我无法访问 MATLAB，因此无法亲自测试示例，但时间1.359625似乎表明它是在普通 PC 上进行测试的，就像我的一样。

但我无法用 Fortran 或 Julia 等其他语言重现时间！（我们知道，他们俩都以数值计算的性能而闻名。好吧，我承认我绝不是 fortran 或 julia 的专家。）

以下是我用于测试的样本。我使用的是配备 i7-8565U CPU、Win 10 …

math performance matlab vectorization julia

xzc*_*czd

2021 12-30

10
推荐指数

2
解决办法

338
查看次数

向量化 sapply 函数

我正在尝试对以下函数进行矢量化以删除 sapply 循环。我正在计算累积偏度。

cskewness <- function(.x) {
  skewness <- function(.x) {
    sqrt(length(.x)) * sum((.x - mean(.x))^3) / (sum((.x - mean(.x))^2)^(3 / 2))
  }
  sapply(seq_along(.x), function(k, z) skewness(z[1:k]), z = .x)
}

Run Code Online (Sandbox Code Playgroud)

我的代数没搞对。有这个是错误的：

skewness2 <- function(.x) {
  n <- length(.x)
  csum <- cumsum(.x)
  cmu <- csum / 1:length(.x)
  num <- cumsum(.x - cmu)^3
  den <- cumsum((.x - cmu)^2)^(3/2)
  sqrt(n) * num / den
}

Run Code Online (Sandbox Code Playgroud)

正确的代码会产生：

x <- c(1,2,4,5,8)

> cskewness(x)
[1]       NaN 0.0000000 0.3818018 0.0000000 0.4082483
> skewness2(x)
[1]      NaN 1.000000 …

Run Code Online (Sandbox Code Playgroud)

performance r vectorization

MCP*_*tor

2024 01-08

10
推荐指数

2
解决办法

238
查看次数

将二进制矩阵以快速矢量化方式转换为最后一个非零索引的向量

假设在MATLAB中,我有一个矩阵A,其元素为0或1.

如何以更快的矢量化方式获取每列的最后一个非零元素的索引向量？

我可以

[B, I] = max(cumsum(A));

和使用I,但有更快的方法吗？(我假设cumsum会花费一点时间甚至加0和1).

编辑:我想我矢量甚至比我需要快速的更多-福兹先生"循环是伟大的,但在MATLAB每个循环似乎花费了我很多的调试即使是快的时间.

matlab vector matrix vectorization

Joe*_*ger

2017 05-07

9
推荐指数

2
解决办法

2386
查看次数

SSE比FPU慢？

我有一大段代码,其中一部分包含这段代码:

result = (nx * m_Lx + ny * m_Ly + m_Lz) / sqrt(nx * nx + ny * ny + 1);

Run Code Online (Sandbox Code Playgroud)

我已经矢量化如下(一切都已经是float):

__m128 r = _mm_mul_ps(_mm_set_ps(ny, nx, ny, nx),
                      _mm_set_ps(ny, nx, m_Ly, m_Lx));
__declspec(align(16)) int asInt[4] = {
    _mm_extract_ps(r,0), _mm_extract_ps(r,1),
    _mm_extract_ps(r,2), _mm_extract_ps(r,3)
};
float (&res)[4] = reinterpret_cast<float (&)[4]>(asInt);
result = (res[0] + res[1] + m_Lz) / sqrt(res[2] + res[3] + 1);

Run Code Online (Sandbox Code Playgroud)

结果是正确的; 但是,我的基准测试显示矢量化版本较慢:

非矢量化版本需要3750毫秒
矢量化版本需要4050毫秒
设置result到0直接(和完全除去这部分代码)降低了整个过程至2500毫秒

鉴于矢量版本只包含一个集SSE乘法(而不是四个单独的FPU乘法)的,为什么会慢？FPU确实比SSE快,或者这里有混淆变量吗？

(我在移动Core i5上.)

c++ optimization sse simd vectorization

Meh*_*dad

2012 01-13

9
推荐指数

1
解决办法

3514
查看次数

找到小于右边某个元素的每个元素

我需要找到一个向量的元素,这些元素少于它之后的一个或多个元素.在循环中很容易做到:

x = some_vector_values;
for m = 1 : length(x)
  if( any( x(m+1:end) > x(m) )
    do_such_and_such;
  end
end

Run Code Online (Sandbox Code Playgroud)

但速度正在扼杀我.我正试图想出一个有效的解决办法但是我的空白.数组长度可以是数千种,我需要为许多不同的数组执行此操作.

arrays optimization performance matlab vectorization

Ano*_*r85

2014 04-18

9
推荐指数

4
解决办法

499
查看次数

3d阵列的Numpy elementwise产品

我有两个具有形状(N,2,2)的3d阵列A和B,我想根据N轴在每个2x2矩阵上使用矩阵乘积.使用循环实现,它看起来像

C[i] = dot(A[i], B[i])

Run Code Online (Sandbox Code Playgroud)

有没有办法在不使用循环的情况下做到这一点？我已经研究过tensordot,但还是无法让它工作.我想我可能会想要一些类似于tensordot(a, b, axes=([1,2], [2,1]))但却给我一个NxN矩阵的东西.

python arrays numpy matrix vectorization

Rem*_*emy

2015 08-12

9
推荐指数

1
解决办法

1892
查看次数

有效地减去不同形状的numpy数组

使用的numpy的可以减去的形状(3)阵列的优良广播规则v从一个形状(5,3)排列X以

X - v

Run Code Online (Sandbox Code Playgroud)

结果是一个shape(5,3)数组,其中每一行i都是差异X[i] - v.

有没有办法减去形状(n,3)数组w,X以便从w整个数组中减去每一行X而不显式使用循环？

python arrays numpy vectorization numpy-broadcasting

Max*_*ers

2015 11-13

9
推荐指数

1
解决办法

7341
查看次数

查找沿另一个数组中的轴的最小值对应的数组

我有两个三维数组,a和b,并且想要找到b的2D子阵列,其中a的元素沿着第三轴具有最小值,即

a=n.random.rand(20).reshape((5,2,2))
b=n.arange(20).reshape((5,2,2))
c=n.argmin(a,2) #indices with minimal value of a
d=n.zeros_like(c) #the array I want
for i in range(5):
  for j in range(2):
     d[i,j] = b[i,j,c[i,j]]

Run Code Online (Sandbox Code Playgroud)

有没有办法可以在没有双循环的情况下获得这些值？

我知道这个答案: 在numpy数组中将min值替换为另一个但是如果我想让它适用于我的3D数组,我必须做很多重塑操作 - 我想知道是否有更简单的东西.

python arrays numpy vectorization

mzz*_*zzx

2017 05-23

9
推荐指数

1
解决办法

136
查看次数