Mor*_*sen 2 c# asynchronous cuda gpgpu
我正在使用一个C#库,它使用NVIDIA的CUDA将某些工作任务卸载到GPU.一个例子是使用扩展方法将两个数组一起添加:
float[] a = new float[]{ ... }
float[] b = new float[]{ ... }
float[] c = a.Add(b);
Run Code Online (Sandbox Code Playgroud)
此代码中的工作是在GPU上完成的.但是,我希望它是异步完成的,这样只有在需要结果时才会在CPU块上运行代码(如果结果还没有在GPU上完成).为此,我创建了一个隐藏异步执行的ExecutionResult类.在使用中,这看起来如下:
float[] a = new float[]{ ... }
float[] b = new float[]{ ... }
ExecutionResult res = a.Add(b);
float[] c = res; //Implicit converter
Run Code Online (Sandbox Code Playgroud)
在最后一行,程序将阻止数据是否已准备就绪.我不确定在ExecutionResult类中实现这种阻塞行为的最佳方法,因为我对同步线程和那些类型的东西不是很熟悉.
public class ExecutionResult<T>
{
private T[] result;
private long computed = 0;
internal ExecutionResult(T[] a, T[] b, Action<T[], T[], Action<T[]>> f)
{
f(a, b, UpdateData); //Asych call - 'UpdateData' is the callback method
}
internal void UpdateData(T[] data)
{
if (Interlocked.Read(ref computed) == 0)
{
result = data;
Interlocked.Exchange(ref computed, 1);
}
}
public static implicit operator T[](ExecutionResult<T> r)
{
//This is obviously a stupid way to do it
while (Interlocked.Read(ref r.computed) == 0)
{
Thread.Sleep(1);
}
return result;
}
}
Run Code Online (Sandbox Code Playgroud)
传递给构造函数的Action是一个异步方法,它在GPU上执行实际工作.嵌套的Action是异步回调方法.
我主要担心的是如何最好/最优雅地处理转换器中的等待,以及是否有更合适的方法来解决整个问题.如果我需要详细说明或进一步解释,请发表评论.
| 归档时间: |
|
| 查看次数: |
1124 次 |
| 最近记录: |