tal*_*ies 12
到目前为止,所有发布的支持CUDA的架构都像SIMD机器一样运行.当warp中存在分支差异时,两个代码路径都由warp中的所有线程执行,而不跟随活动路径的线程执行NOP的功能等价物(我想我记得有条件执行)标志附加到warp中的每个线程,允许非执行线程被屏蔽掉).
所以在你的例子中,90个周期的答案可能是比替代方案更接近实际发生的事情.
归档时间: |
|
查看次数: |
4861 次 |
最近记录: |