继续在nvidia gpu上获得CL_INVALID_KERNEL_ARGS

Question

继续在nvidia gpu上获得CL_INVALID_KERNEL_ARGS

我在nvidia GPU上使用OpenCL,当我尝试执行内核时,我一直得到CL_INVALID_KERNEL_ARGS.我把它归结为一个非常简单的程序:

__kernel void foo(int a, __write_only image2d_t bar)
{
  int 2 coords = {0, get_global_id(0)};
  write_imagef(bar, coords, (float4)a);
}

使用以下C程序(为简洁起见,跳过初始化和错误检查位)

cl_kernel foo = clCreateKernel(program, "foo", &err);
int a = 42;
clSetKernelArg(foo, 0, sizeof(int), &a);

cl_image_format fmt = {CL_INTENSITY, CL_FLOAT};
cl_mem bar = clCreateImage2D(ctx, CL_MEM_WRITE_ONLY|CL_MEM_ALLOC_HOST_PTR, &fmt, 100, 1, 0, NULL, &err));
clSetKernelArg(foo, 1, sizeof(cl_mem), &bar);

size_t gws[] = {100};
size_t lws[] = {100};
cl_event evt;
clEnqueueNDRangeKernel(queue, foo, 1, NULL, gws, lws, 0, NULL, &evt);
clFinish(queue);

clEnqueueNDRangeKernel保持返回CL_INVALID_KERNEL_ARGS.有任何想法吗？

Answer 1

You*_* Nj 5

您正在尝试将主机上的变量传递给内核。您需要创建一个cl_mem变量，然后使用复制该值clEnqueueWriteBuffer，然后将cl_mem或cl_int变量传递给内核。除此之外，你的代码对我来说看起来很好。

Answer 2

dec*_*iar 5

请参阅/sf/answers/1439638931/。

您传递的缓冲区对象有多大？__constant 参数是从单独的内存空间分配的，而不是从全局内存中分配的，因此您可能已经用完了常量内存

检查CL_DEVICE_MAX_CONSTANT_BUFFER_SIZE使用clGetDeviceInfo以确保您没有超过该尺寸。

归档时间：	13 年，2 月前
查看次数：	5635 次
最近记录：	8 年，6 月前