我有一个单元格数组,其中每个单元格都是一个不同大小的矩阵。我想将所有矩阵的每个元素连接成一个列向量。所以
X1=rand(2,3); % Total 6 elements.
X2=rand(3,4); % Total 12 elements.
X = {X1, X2}; % Total 18 elements in a 2-cell array.
% How to unroll everything from X into one giant column vector of size 18x1 ?
% Edit: The above example only shows two matrices, X1 and X2, but there could be n such matrices in the cell array.
X = {X1, X2, ... , Xn};
Run Code Online (Sandbox Code Playgroud)
我可以用循环来做到这一点,但很好奇是否有更快的方法。我查看了 cell2mat 并重塑,但无法让他们这样做(尺寸不匹配错误)。在网络上搜索似乎没有帮助。
这是我的 for 循环解决方案:
unrolled_X=[];
for i=1:length(X)
unrolled_X = [unrolled_X; X{i}(:)];
end
Run Code Online (Sandbox Code Playgroud)
编辑2:感谢您的回答。我学到了一些关于性能的新东西。我对@HansHirse、@lucien-xhh 和@wolfie 的 3 个解决方案进行了基准测试。结果有点出人意料。注意我实际上正在运行 Octave(版本 5.2.0。)。
所以没有 cell2fun 的解决方案是最快的。其他 2 个解决方案都使用 cellfun,但出人意料地接近最快,而另一个是最快的两倍。代码和结果如下。
代码
function run_benchmarks()
X={};
for i=1:5
X{i}=rand(1000,1000);
end
fprintf("unroll_with_cellfun: %f\n", benchmark(@()unroll_with_cellfun(X), 100));
fprintf("unroll_with_cellfun2: %f\n", benchmark(@()unroll_with_cellfun2(X), 100));
fprintf("unroll_with_vertcat: %f\n", benchmark(@()unroll_with_vertcat(X), 100));
end
function unrolled_X = unroll_with_cellfun(X)
unrolled_X = cell2mat(cellfun(@(x) x(:), X, 'UniformOutput', false).');
end
function unrolled_X = unroll_with_cellfun2(X)
unrolled_X = cell2mat(cellfun(@(x) x(:).', X, 'UniformOutput', false)).';
end
function unrolled_X = unroll_with_vertcat(X)
unrolled_X = cell(length(X),1);
for ii = 1:length(X)
unrolled_X{ii} = X{ii}(:);
end
unrolled_X = vertcat( unrolled_X{:} );
end
function elapsed_time_in_seconds = benchmark(f, N)
% benchmark runs the function 'f' N times and returns the elapsed time in seconds.
timeid = tic;
for i=1:N
output = f();
end
elapsed_time_in_seconds = toc(timeid);
end
Run Code Online (Sandbox Code Playgroud)
结果:
octave:161> run_benchmarks
unroll_with_cellfun: 1.240324
unroll_with_cellfun2: 0.606957 <-- Close to fastest.
unroll_with_vertcat: 0.597657 <-- FASTEST
Run Code Online (Sandbox Code Playgroud)
惊讶地看到 cellfun2 几乎与最快的解决方案相同,即使它与 cellfun2 几乎相同,cellfun 也需要 2 倍的时间。
预分配循环将提高性能和更好的实践
unrolled_X = cell(length(X),1);
for ii = 1:length(X)
unrolled_X{ii} = X{ii}(:);
end
unrolled_X = vertcat( unrolled_X{:} );
Run Code Online (Sandbox Code Playgroud)
任何类似的速记cellfun
基本上都是这个伪装cell2mat
的循环,并在幕后使用循环进行连接,但有额外的检查,因此实际上可能会导致轻微的减速。