Tay*_*orP 2 c++ opengl performance user-interface glsl
我计划为我目前正在进行的项目之一编写一个基于 GL 的 UI。大多数 UI 不会有纹理(只是平面颜色),但某些元素需要支持单个图像。元素只需要缩放和平移 - 不需要复杂的动画或旋转。不过,UI 不一定是静态的 - 元素可能在应用程序的生命周期中出现/消失,并且在某些情况下需要简单的滑动动画。还需要鼠标悬停、单击、选择等状态。
我正在尝试确定管理和存储 UI 元素本身几何形状的最佳方法。我的第一个想法是创建一个包含一个四边形的单个顶点缓冲区,并将该四边形用于所有 UI 绘制调用。当然,变换将与四边形一起发送到着色器。
传统观点认为,最小化状态变化可以提高性能——这是使用单个 VB 的好处。但是,必须为每个 UI 元素转换四边形会增加成本。由于用户界面不会经常移动,这似乎有点多余。
在现代硬件上,转换单个四边形是否更便宜,或者发送转换数据的成本是否超过仅绑定单个 VB 的好处?我最好为每个 UI 元素维护单独的几何图形(可能在 CPU 上计算)吗?UI系统是否有其他常用的推荐方法?
在现代硬件/驱动程序中,更改最昂贵的状态是渲染目标 (FBO)、着色器(GLSL 程序)和纹理。顶点缓冲区(即顶点属性指针,而不是实际数据)和统一状态实际上可能是在绘制调用之间更改的最便宜的状态。
导致绘制调用成本高昂的原因之一是由于状态更改而必须进行的所有状态验证,因此 FBO(可能对 GL 中的任何内容进行最复杂的验证)成本高昂也就不足为奇了更换制服(几乎可以在调用glUniform* (...)返回之前完全验证)很便宜。
这样一来,假设您为每个 UI 元素使用相同的纹理和着色器,那么更改一两个制服并发出另一个绘制调用就不会非常昂贵。
如果您有足够的小型绘制调用,您可以将变换合并为统一缓冲区对象/缓冲区纹理,然后使用某种形式的实例化将其减少为单个绘制调用。除非替换的绘制调用数量足够大,否则您不会看到这样做带来的可衡量的性能优势;很难概括这一点何时成为实际优化。如果你愿意的话,你可以随意摆弄它,但从声音来看,你可能不会从中得到任何有用的东西。
相反,您可能会考虑将 GUI 绘制到纹理中。对于 GUI 中没有任何变化的帧,您可以使用前一帧生成的纹理并跳过任何实际的 GUI 合成。当某些内容发生变化时,您可以使用模板/剪刀仅清除 GUI 的“脏”部分,然后重新绘制它们。最终,您将在每一帧的视口上拉伸 GUI 纹理,唯一的区别是,在某些帧上您将重新绘制部分或全部纹理,而在其他帧上您将重用整个纹理。