为了写入内核函数内的浮点数组,您需要向内核提供一个缓冲区参数。参数应该具有类型device float *并带有属性buffer,指定它将占用哪个参数表槽:
kernel void my_kernel(device float *data [[buffer(0)]],
uint threadIndex [[thread_position_in_grid]])
{
data[threadIndex] = /* calculate value for this element */;
}
Run Code Online (Sandbox Code Playgroud)
要在您的应用程序代码中创建这样的缓冲区,请请求您的 Metal 设备分配它:
let buffer = device.makeBuffer(length: MemoryLayout<Float>.stride * dataCount,
options: [])!
Run Code Online (Sandbox Code Playgroud)
在 Mac 上,您可能希望使用该.storageModeManaged选项创建缓冲区,该选项不会自动将您从内核写入的值同步回 CPU 可读内存。您可以使用 blit 编码器和synchronize(resource:)从 GPU 内存复制回来的方法。在 iOS 上,不存在托管缓冲区,并且除了通常情况之外不需要同步(确保您永远不会从其他人正在写入的同一位置读取数据)。
当您准备好分派计算工作时,请将缓冲区绑定为计算命令编码器的参数:
computeCommandEncoder.setBuffer(buffer, offset: 0, index: 0)
Run Code Online (Sandbox Code Playgroud)
调度对完成工作有意义的任何大小的网格。在命令缓冲区中对您可能需要执行的任何其他工作(包括同步命令)进行编码,提交命令缓冲区,并确保它在尝试读取缓冲区内容之前已完成。
要读取缓冲区的内容,请将缓冲区的内容转换为UnsafeMutableBufferPointer适当的类型,这允许您像对待任何其他缓冲区一样对待缓冲区Sequence:
let data = UnsafeMutableBufferPointer<Float>(start: buffer.contents().assumingMemoryBound(to: Float.self),
count:dataCount)
// iterate over elements of data or whatever...
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1641 次 |
| 最近记录: |