bes*_*sil 2 macos opencl java-6 aparapi
我正在研究 Aparapi ( https://code.google.com/p/aparapi/ ),并且其中包含的示例之一有一种奇怪的行为。示例是第一个“添加”。构建并执行它,就可以了。我还放了下面的代码来测试GPU是否真的被使用
if(!kernel.getExecutionMode().equals(Kernel.EXECUTION_MODE.GPU)){
System.out.println("Kernel did not execute on the GPU!");
}
Run Code Online (Sandbox Code Playgroud)
而且效果很好。但是,如果我尝试将数组的大小从 512 更改为大于 999 的数字(例如 1000),则会得到以下输出:
!!!!!!! clEnqueueNDRangeKernel() failed invalid work group size
after clEnqueueNDRangeKernel, globalSize[0] = 1000, localSize[0] = 128
Apr 18, 2013 1:31:01 PM com.amd.aparapi.KernelRunner executeOpenCL
WARNING: ### CL exec seems to have failed. Trying to revert to Java ###
JTP
Kernel did not execute on the GPU!
Run Code Online (Sandbox Code Playgroud)
这是我的代码:
final int size = 1000;
final float[] a = new float[size];
final float[] b = new float[size];
for (int i = 0; i < size; i++) {
a[i] = (float)(Math.random()*100);
b[i] = (float)(Math.random()*100);
}
final float[] sum = new float[size];
Kernel kernel = new Kernel(){
@Override public void run() {
int gid = getGlobalId();
sum[gid] = a[gid] + b[gid];
}
};
Range range = Range.create(size);
kernel.execute(range);
System.out.println(kernel.getExecutionMode());
if (!kernel.getExecutionMode().equals(Kernel.EXECUTION_MODE.GPU)){
System.out.println("Kernel did not execute on the GPU!");
}
kernel.dispose();
Run Code Online (Sandbox Code Playgroud)
}
我尝试使用指定尺寸
Range range = Range.create(size, 128);
Run Code Online (Sandbox Code Playgroud)
正如 Google 小组中所建议的那样,但没有任何改变。
我目前正在 Mac OS X 10.8 上运行 Java 1.6.0_43。Aparapi版本是最新的(2012-01-23)。
我错过了什么吗?有任何想法吗?
提前致谢
小智 5
Aparapi 继承了 OpenCL 的“网格样式”实现。当您指定执行范围(例如 1024)时,OpenCL 会将这个“范围”分成大小相等的组。可能是 4 组,每组 256 个,或 8 组,每组 128 个。
组大小必须是范围的一个因素(因此assert(range%groupSize==0))。
默认情况下,Aparapi 在内部选择组大小。
但是您选择完全指定要使用的范围和组大小
范围 r= Range.range(n,128)
您有责任确保 n%128==0。
从错误来看,您似乎选择了 Range.range(1000,128)。
遗憾的是 1000 % 128 != 0 所以这个范围将失败。
如果您指定
范围 r = Range.range(n)
Aparapi 将通过查找 n 的最大公因数来选择有效的组大小。
尝试删除 128 作为第二个参数。
加里
| 归档时间: |
|
| 查看次数: |
1501 次 |
| 最近记录: |