如果我在cuda中使用fma(a,b,c),则意味着公式a b + c是在单个三元运算中计算的.但是如果我想计算-a b + c,那么调用fma(-a,b,c)是否还需要多次运算?
cuda fma
cuda ×1
fma ×1