小编Dam*_*oon的帖子

OpenMP和MKL线程

我在Fortran中有一个代码,它使用DGESVDMKL并在8核上运行英特尔编译器.代码通过OpenMP加速.另外我知道OpenMP和MKL有自己的设置来设置线程数(omp_num_threadsmkl_num_threads).我想知道最佳线程数.我应该OMP_NUM_THREADS=1在调用LAPACK例程之前设置吗?OpenMP线程的数量是否会影响MKL线程数?

fortran openmp intel-mkl

6
推荐指数
1
解决办法
3087
查看次数

编写多个内核或单个内核

假设我有两大功能.在单独的内核中编写它们并按顺序调用它们会更好吗,还是最好只编写一个内核?(我不想回读数据并在主机和设备之间强制形成).如果我想多次调用内核,速度会怎样?

opencl

5
推荐指数
1
解决办法
4608
查看次数

cl_datatype和通常的数据类型有什么区别

有关大小和用法的cl_Type和常规类型(如cl_float和float)之间有什么区别.cl_float可以在内核中使用吗?

谢谢

opencl

3
推荐指数
1
解决办法
1270
查看次数

OpenCL中CL_MEM_USE_HOST_PTR和CL_MEM_COPY_HOST_PTR的基准

我在主机上有一个向量,我想将它减半并发送到设备.做一个基准测试表明它CL_MEM_ALLOC_HOST_PTRCL_MEM_USE_HOST_PTR速度更快,速度更快CL_MEM_COPY_HOST_PTR.此外,设备上的内存分析不会显示设备上创建的缓冲区大小有任何差异.这与Khronos-clCreateBuffer上提到的标志的文档不同.有谁知道发生了什么?

opencl

3
推荐指数
1
解决办法
6830
查看次数

标签 统计

opencl ×3

fortran ×1

intel-mkl ×1

openmp ×1