我正在使用OpenCL运行内核基准测试。我知道我可以使用OpenCL供应商(即ioc64或poclcc)的各种工具离线编译内核。问题是我无法从这些工具,OpenCL运行时开销或类似的程序集获得无法解释的性能结果。
ioc64
poclcc
我希望看到由我的基准程序编译和执行的在线编译内核的组装。有什么办法吗?
我的方法是从cl::program或cl::kernel对象中获取此程序集,但我没有找到任何方法来执行此操作。感谢您的建议或解决方案。
cl::program
cl::kernel
assembly compilation opencl
assembly ×1
compilation ×1
opencl ×1