我是GPGPU编程的新手,我正在使用NVIDIA实现的OpenCL.
我的问题是如何计算GPU设备的限制(线程数).
根据我的理解,有许多工作组(相当于CUDA中的块)包含许多工作项(~cuda线程).
如何获取卡上存在的工作组数量(可以同时运行)和一个工作组中的工作项数?
CL_DEVICE_MAX_COMPUTE_UNITS对应的是什么?
khronos规范说明了核心("OpenCL设备上的并行计算核心数".)与我的图形卡规范中给出的CUDA核心有什么不同.在我的情况下,openCL给出14,我的GeForce 8800 GT有112核,基于NVIDIA网站.
CL_DEVICE_MAX_WORK_GROUP_SIZE(在我的情况下为512)是否对应于给予特定工作组的工作项总数或可以在工作组中同时运行的工作项数?
任何建议都将非常感激.