根据英特尔内部指南,
vxorpd ymm, ymm, ymm
vpxor ymm, ymm, ymm
两者有什么区别?在我看来,两个指令都会对ymm寄存器的所有256位执行按位异或.如果我使用vxorpd整数数据会有任何性能损失(反之亦然)?
vxorpd
intel simd vectorization xor avx
avx ×1
intel ×1
simd ×1
vectorization ×1
xor ×1