正如 Turboscrew 所提到的,最接近 CUDA 汇编的是 PTX 代码。我认为在这个答案中添加实际生成 PTX 代码的方法会更有用。
这可以通过以下方式生成:
nvcc -ptx -o kernel.ptx kernel.cu
kernel.cu
源文件在哪里,kernel.ptx
目标 PTX 文件在哪里。
另外,这里是 NVidia 的 PTX 文档的链接:
http://docs.nvidia.com/cuda/parallel-thread-execution/index.html
如果您有一些装配知识,那么大部分都是相当简单的。有一些特殊的函数可以使用,但查找它们以获取更多详细信息会很有用。
归档时间: |
|
查看次数: |
3722 次 |
最近记录: |