有 ARM 软件优化指南(例如, neoverse n1 的https://developer.arm.com/documentation/srog309707/latest)。
本指南似乎不包含 Neon 或 SVE 的延迟和吞吐量。NEON 或 SVE 是否有单独的指南(例如,INSR (SIMD&FP scalar)指令的指令延迟和吞吐量)?
INSR (SIMD&FP scalar)
指针会非常有帮助!
arm neon arm64 sve
arm ×1
arm64 ×1
neon ×1
sve ×1