我想开发一种可以在CPU或GPU上运行的算法的库。GPU可以是Nvidia(然后该算法将使用CUDA)或不是(那么该算法将使用OpenCL)。
我想在这个项目中模拟GPU,因为也许:
我将使用不同的计算机来开发软件,其中一些没有GPU。
该软件最终将在具有或没有GPU的服务器中执行,并且必须执行并通过单元测试。
有没有一种方法可以仿真GPU以进行单元测试?
在以下链接中:
他们展示了一个解决方案,但仅适用于CUDA,不适用于OpenCL,他们提出的“ GPUOcelot”软件也不再得到积极维护。