小编Dam*_*oon的帖子

OpenMP和MKL线程

我在Fortran中有一个代码,它使用DGESVDMKL并在8核上运行英特尔编译器.代码通过OpenMP加速.另外我知道OpenMP和MKL有自己的设置来设置线程数(omp_num_threads和mkl_num_threads).我想知道最佳线程数.我应该OMP_NUM_THREADS=1在调用LAPACK例程之前设置吗？OpenMP线程的数量是否会影响MKL线程数？

fortran openmp intel-mkl

Dam*_*oon

2012 12-09

6
推荐指数

1
解决办法

3087
查看次数

编写多个内核或单个内核

假设我有两大功能.在单独的内核中编写它们并按顺序调用它们会更好吗,还是最好只编写一个内核？(我不想回读数据并在主机和设备之间强制形成).如果我想多次调用内核,速度会怎样？

opencl

Dam*_*oon

2012 03-01

5
推荐指数

1
解决办法

4608
查看次数

cl_datatype和通常的数据类型有什么区别

有关大小和用法的cl_Type和常规类型(如cl_float和float)之间有什么区别.cl_float可以在内核中使用吗？

谢谢

opencl

Dam*_*oon

lucky-day

3
推荐指数

1
解决办法

1270
查看次数

OpenCL中CL_MEM_USE_HOST_PTR和CL_MEM_COPY_HOST_PTR的基准

我在主机上有一个向量,我想将它减半并发送到设备.做一个基准测试表明它CL_MEM_ALLOC_HOST_PTR比CL_MEM_USE_HOST_PTR速度更快,速度更快CL_MEM_COPY_HOST_PTR.此外,设备上的内存分析不会显示设备上创建的缓冲区大小有任何差异.这与Khronos-clCreateBuffer上提到的标志的文档不同.有谁知道发生了什么？

opencl

Dam*_*oon

2014 05-25

3
推荐指数

1
解决办法

6830
查看次数