小编use*_*914的帖子

Cuda零拷贝性能

有没有人有使用零拷贝(这里是参考:默认固定内存和零拷贝内存)内存模型分析CUDA应用程序性能的经验?

我有一个使用零拷贝功能的内核和NVVP我看到以下内容:

以平均问题大小运行内核我得到0.7%的指令重放开销,所以没什么大不了的.所有这0.7%都是全局内存重放开销.

当我真正提升问题大小时,我得到95.7%的指令重放开销,所有这都是由于全局内存重放开销.

但是,正常问题大小内核运行和非常大的问题大小内核运行的全局负载效率和全局存储效率是相同的.我不确定如何将这些指标组合起来.

我不确定的主要问题是NVVP中的哪些统计信息可以帮助我了解零拷贝功能的情况.我应该关注什么类型的统计数据?

c++ cuda zero-copy nvvp

1
推荐指数
1
解决办法
1391
查看次数

标签 统计

c++ ×1

cuda ×1

nvvp ×1

zero-copy ×1