减少顶点缓冲区中的重复数据

Ric*_*lor 9 opengl-es vbo opengl-es-2.0

我一次使用3个顶点缓冲区(实际上我有很多,但一次只使用3个).

它们包含在着色器中混合在一起以生成所需输出的信息 - 2D骨架动画.

有两个骨骼缓冲区,包含任何给定帧的骨骼的位置/旋转/比例.

有一个皮肤缓冲区,其中包含用于渲染纹理区域的顶点,就像它在世界原点一样,(0,0).

在着色器中,两个骨骼缓冲区与缓动值(作为一个整体传递)组合,然后通过变换外观顶点,将零件渲染在正确的位置.

这表现很好,并且在我开始的地方是一个很好的改进 - 我在GPU上计算了所有内容,并且只是传递了x/y/u/v坐标,我被限制为每帧都向GPU传输如此多的数据.

但是,有很多重复的信息.皮肤缓冲区仅包含它所需的内容,每个皮肤部分有4个顶点,每个顶点都是唯一的.

当它与骨骼结合时,每个骨骼顶点重复4次 - 以匹配皮肤缓冲区.在移动设备上工作,这是一个令人痛苦的事情,因为我的记忆力很低,让我感到非常沮丧.

如果只有一个骨骼,这就是缓冲区的外观.

骨缓冲液1

[x1,y1,rot1] [x1,y1,rot1] [x1,y1,rot1] [x1,y1,rot1]

骨缓冲液2

[x2,y2,rot2] [x2,y2,rot2] [x2,y2,rot2] [x2,y2,rot2]

皮肤缓冲

[xA,yA,uA,vA] [xB,yB,uB,vB] [xC,yC,uC,vC] [xD,yD,uD,vD]

我不会发布完整的着色器,因为那里有太多额外的东西(旋转和缩放工作类似):

attribute vec2 bonePosition1; // x1, y1
attribute vec2 bonePosition2; // x2, y2
attribute vec2 skinPosition; // xA (or xB .. ), yA (or yB .. )
uniform float a; // Some value 0..1 depending on time
...
vec2 bonePosition = mix(bonePosition1, bonePosition2, a);
vec2 combinedPosition = skinPosition * bonePosition;
Run Code Online (Sandbox Code Playgroud)

注意; 因为我主要针对iOS(其他人也是,但它是最严格的),我知道我只限于16个属性.

有没有办法缩小骨骼缓冲区的内存占用量?我有很多帧到一个皮肤缓冲区.

kea*_*ine 0

GL_ELEMENT_ARRAY_BUFFER正如我所见,您需要为带有数据 ( ) 的缓冲区绑定多个索引缓冲区 ( ) GL_ARRAY_BUFFER。如果您能够绑定 2 个GL_ARRAY_BUFFER缓冲区,那么您也可以绑定一个单独的缓冲区GL_ELEMENT_ARRAY_BUFFER。我不知道这是否可以在OpenGL ES中实现。如果这是不可能的,您可以尝试使用整数而不是浮点数来节省内存,但我相信这不适用于骨骼平移/旋转值。

关于你的笔记。要克服 16 个属性的限制,您可以将较小的vec2属性组合成vec4. 例如,您可以将bonePosition1和合并bonePosition2为一个vec4

attribute vec4 bonePosition12;
Run Code Online (Sandbox Code Playgroud)

然后在着色器中这样使用它:

vec2 bonePosition1 = vec2(bonePosition12.x,bonePosition12.y);
vec2 bonePosition2 = vec2(bonePosition12.z,bonePosition12.w);
Run Code Online (Sandbox Code Playgroud)

这可能会对性能产生一些轻微影响,但由于此代码位于顶点着色器中,与着色器的数学相比,性能下降应该可以忽略不计。我已经使用类似的代码来操纵颜色(在片段着色器中)并且性能还可以。