相关疑难解决方法(0)

在内核代码中检测 OpenCL 设备供应商

我正在编写一些特定于平台的优化,虽然我知道我可以解析主机代码中的供应商字符串并使用该-D选项将其发送到内核,但在内核中检测供应商可能更方便直接,无需主机参与(这样即使不访问主机源代码也可以优化内核,...)。

到目前为止,我已经提出以下几点:

#ifdef __NV_CL_C_VERSION
/**
 *  @def NVIDIA
 *  @brief defined when compiling on NVIDIA GPUs
 */
#define NVIDIA
#endif // __NV_CL_C_VERSION

#if defined(__WinterPark__) || defined(__BeaverCreek__) || defined(__Turks__) || \
    defined(__Caicos__) || defined(__Tahiti__) || defined(__Pitcairn__) || \
    defined(__Capeverde__) || defined(__Cayman__) || defined(__Barts__) || \
    defined(__Cypress__) || defined(__Juniper__) || defined(__Redwood__) || \
    defined(__Cedar__) || defined(__ATI_RV770__) || defined(__ATI_RV730__) || \
    defined(__ATI_RV710__) || defined(__Loveland__) || defined(__GPU__) || \
    defined(__Hawaii__)
#define AMD
/**
 *  @def AMD
 *  @brief defined when compiling on …
Run Code Online (Sandbox Code Playgroud)

macros opencl

5
推荐指数
1
解决办法
783
查看次数

标签 统计

macros ×1

opencl ×1