它可以在每个周期执行四次8位操作(SIMD操作)还是只执行一次?通常,较高位被设为零,8位被视为32位字,其较高位为零以执行这种操作.目前处理器中是否有任何硬件功能可以帮助每个周期执行更多数量的低位操作(特别是在NVIDIA GPU中)?
cuda gpu computer-architecture
computer-architecture ×1
cuda ×1
gpu ×1