OpenCL计算冻结了屏幕

jcx*_*cxz 4 freeze opencl

正如标题所说,当我跑我OpenCL的内核整个屏幕停止重绘(图像显示在监视器上,直到我的程序与计算做仍然是相同的这是真实的,即使在情况下,我从我的笔记本电脑上拔下它,然后重新插入-八方通显示相同的图像)并且计算机似乎也没有对鼠标移动作出反应 - 光标停留在相同的位置.

我不确定为什么会这样.它可能是我程序中的错误,还是标准行为?

在Google上搜索时,我在AMD的论坛上找到了这个帖子,有些人认为这是正常的,因为当GPU忙于计算时,GPU无法刷新屏幕.

如果这是真的,还有什么方法可以解决这个问题吗?

我的内核计算可能需要几分钟的时间,并且我的计算机实际上几乎无法使用整个时间真的很痛苦.

EDIT1:这是我目前的设置:

  • 显卡是ATI Mobility Radeon HD 5650,配备512 MB内存和AMD网站上最新的Catalyst beta驱动程序
  • 图形是可切换的 - 英特尔集成/ ATI专用卡,但我已禁用BIOS中的切换,因为否则我无法让驱动程序在Ubuntu上工作.
  • 操作系统是Ubuntu 12.10(64位),但这也发生在Windows 7(64位)上.
  • 我通过HDMI插入显示器(但笔记本电脑屏幕也冻结了,所以这应该不是问题)

编辑2:所以在玩了一天我的代码之后,我从你的回复中得到了建议并将我的算法改为这样的(伪代码):

for (cl_ulong chunk = 0; chunk < num_chunks; chunk += chunk_size)
{
  /* set kernel arguments that are different for each chunk */
  clSetKernelArg(/* ... */);

  /* schedule kernel for next execution */
  clEnqueueNDRangeKernel(cmd_queue, kernel, 1, NULL, &global_work_size, NULL, 0, NULL, NULL);

  /* read out the results from kernel and append them to output array on host */
  clEnqueueReadBuffer(cmd_queue, of_buf, CL_TRUE, 0, chunk_size, output + chunk, 0, NULL, NULL);
}
Run Code Online (Sandbox Code Playgroud)

所以现在我将整个工作负载分成主机并以块的形式发送到GPU.对于每个数据块,我将新内核排入队列,我从中得到的结果以正确的偏移量附加到输出数组.

这是你的意思,计算应该划分?

这似乎是解决冻结问题的方法,现在我能够处理比可用GPU内存大得多的数据,但我还是要做一些好的性能测量,看看什么是好的块大小.. .

chi*_*ies 5

每当GPU运行OpenCL内核时,它就完全专注于OpenCL.一些现代的Nvidia GPU是例外,我认为从GeForce GTX 500系列开始,如果这些内核没有使用所有可用的计算单元,它可以运行多个内核.

您的解决方案是将您的计算分成多个短内核调用,这是最好的全面解决方案,因为它甚至可以在单GPU机器上运行,或投资于廉价的GPU来驱动您的显示器.

如果要在GPU上运行长内核,则必须禁用GPU的超时检测和恢复,或者使超时延迟超过最大内核运行时间(更好,因为仍然可以捕获错误),请参阅此处了解如何执行此操作.