Matlab:有没有办法加快计算数字的符号?

ggk*_*ath 3 matlab

我的程序中的瓶颈是计算数组中所有数字的数字符号,当数组大小非常大时.我展示了我在下面尝试过的两种方法,两种方法都有类似的结果.我有16GB的RAM,阵列占用约5GB.我看到的问题是签名功能占用了大量的RAM +虚拟内存.任何人都知道一种方法来减少内存需求并加快将数组输入的符号放入数组输出的过程(见下文)?

使用if或switch命令的for循环不会耗尽内存,但需要一个小时才能完成(方式太长).

size = 1e9; % size of large array (just an example, could be larger)
output = int8(zeros(size,1)-1); % preallocate to -1
input = single(rand(size,1));   % create random array between 0 and 1
scalar = single(0.5); % just a scalar number, set to 0.5 (midpoint) for example

% approach 1 (comment out when using approach 2)
output = int8(sign(input - scalar));  % this line of code uses a ton of RAM and virtual memory

% approach 2
output(input>scalar) = 1;            % this line of code uses a ton of RAM and virtual memory
output(input==scalar) = 0;           % this line of code uses a ton of RAM and virtual memory
Run Code Online (Sandbox Code Playgroud)

在此先感谢您的任何建议.

Ray*_*Ray 6

如果使用for循环但是以块的形式传递数据,它几乎与完全矢量化版本一样快,但没有内存开销:

chunkSize = 1e7;
for start=1:chunkSize:size
    stop = min(start+chunkSize, size);
    output(start:stop) = int8(sign(input(start:stop)-scalar));
end
Run Code Online (Sandbox Code Playgroud)

此外,您的初始化代码正在创建双精度数组,然后将它们转换为单/整数数组.您可以通过执行以下操作来节省一些临时内存使用(和时间):

input = rand(size, 1, 'single');
output = zeros(size, 1, 'int8') - 1;
Run Code Online (Sandbox Code Playgroud)