我有一个非常大的数组(例如1000万个元素),它只包含1和0.我也有一堆并行线程(例如10),我想将这个大型数组块分成不同的线程,并使每个线程对它们负责的部分求和.
我使用"+"运算符编写了C&pthreads中的问题.但是,由于数组只包含1和0,我想知道有没有更快的方法来实现这个求和?(通过按位运算符,移位等?)由于我处理的是非常大的数组,因此天真的求和会破坏性能.
c parallel-processing bit-manipulation
bit-manipulation ×1
c ×1
parallel-processing ×1