我在Android JNI上使用Neon实现了一个算法.当我想要将向量添加到一起时,我注意到有两种类型的方法,我无法发现差异.
// pairwise addition
int8x8_t vpadd_s8(int8x8_t a, int8x8_t b); // VPADD.I8 d0,d0,d0
// addition
int8x8_t vadd_s8(int8x8_t a, int8x8_t b); // VADD.I8 d0,d0,d0
Run Code Online (Sandbox Code Playgroud)
第二个做你期望的.它取a中的ith int8并将其添加到b中的ith int8.为什么这两种方法?