从计算着色器写入持久映射的 SSBO 失败

Ich*_*aum 1 opengl scala lwjgl opengl-4

我正在尝试使用计算着色器写入 SSBO 并在 CPU 上读回数据。

计算着色器只是一个写入 24 个浮点的 1x1x1 玩具示例:

#version 450 core

layout(local_size_x = 1, local_size_y = 1, local_size_z = 1) in;

layout (std430, binding = 0) buffer particles {
    float Particle[];
};

void main() {
    for (int i = 0; i < 24; ++i) {
        Particle[i] = i + 1;
    }
}
Run Code Online (Sandbox Code Playgroud)

这就是我运行着色器并读取数据的方式:

val bufferFlags = GL_MAP_READ_BIT | GL_MAP_PERSISTENT_BIT | GL_MAP_COHERENT_BIT
val bufferSize = 24 * 4
val bufferId = glCreateBuffers()

glNamedBufferStorage(bufferId, bufferSize, bufferFlags)

val mappedBuffer = glMapNamedBufferRange(bufferId, 0, bufferSize, bufferFlags)

mappedBuffer.rewind()
val mappedFloatBuffer = mappedBuffer.asFloatBuffer()

mappedFloatBuffer.rewind()

val ssboIndex = glGetProgramResourceIndex(progId, GL_SHADER_STORAGE_BLOCK, "particles")

val props = Array(GL_BUFFER_BINDING)
val params = Array(-1)
glGetProgramResourceiv(progId, GL_SHADER_STORAGE_BLOCK, ssboIndex, props, null, params)

glBindBufferBase(GL_SHADER_STORAGE_BUFFER, params(0), bufferId)

glUseProgram(progId)

val sync = glFenceSync(GL_SYNC_GPU_COMMANDS_COMPLETE, 0)
glDispatchCompute(1, 1, 1)

glClientWaitSync(sync, 0, 1000000000) match {
  case GL_TIMEOUT_EXPIRED =>
    println("Timeout expired")

  case GL_WAIT_FAILED =>
    println("Wait failed. " + glGetError())

  case _ =>
    println("Result:")

    while(mappedFloatBuffer.hasRemaining) {
      println(mappedFloatBuffer.get())
    }
}
Run Code Online (Sandbox Code Playgroud)

我希望它打印数字 1 到 24,但它却打印 24 个零。使用CPU我可以GL_MAP_WRITE_BIT很好地读取和写入(如果设置了)缓冲区。如果我不使用 DSA(glBindBuffer/ glBufferStorage/glMapBufferRange代替),也会发生同样的情况。但是,如果在着色器运行时未映射缓冲区,并且我仅在打印内容之前映射它,则一切正常。这不正是持久映射缓冲区的用途吗?那么我可以在 GPU 使用它时保持它的映射吗?

我检查了是否有任何错误以及glGetError较新的调试输出,但我没有得到任何错误。

这里(pastebin)是一个完整的工作示例。您需要LWJGL来运行它。

Nic*_*las 5

您的代码中存在许多问题。

首先,将栅栏同步放在要同步的命令之前。与栅栏同步会与栅栏之前执行的所有命令同步,而不是之后。如果您想与计算着色器执行同步,则必须在调度调用之后而不是之前插入栅栏。

其次,同步还不够。对 SSBO 的写入是不连贯的,因此您必须遵循不连贯内存访问的规则才能使它们对您可见。在这种情况下,您需要在计算操作和尝试使用glMemoryBarrier. 由于您是通过映射读取数据,因此正确使用的屏障是GL_CLIENT_MAPPED_BUFFER_BARRIER_BIT

当您使用非持久映射时,您的代码似乎可以工作,但这只是表面现象。由于不正确的不连贯的内存访问(即:缺乏内存屏障),它仍然是未定义的行为。碰巧 UB 做了你想要的事……在这种情况下。