在OpenGL中快速绘制线条

sla*_*007 10 c++ opengl performance

我正在开发一个项目,需要绘制大量数据,因为它是由ADC获取的......在1600像素宽的显示器上,每帧有50,000行.它在具有2007-ish Quadro FX 570的系统上运行良好,但基本上无法跟上具有Intel HD 4000级芯片的机器上的数据.数据负载是每通道5次采样的每秒40次接收的32通道200Hz数据.换句话说,卡只需要达到每秒40帧或更好.

我为所有32个通道使用单个VBO,每个通道有10,000个顶点.VBO基本上被视为每个通道的一系列环形缓冲区.当数据进入时,我根据使用的时间尺度对其进行抽取.因此,基本上,它跟踪每个通道的最小值/最大值.当已经为单个像素列接收到足够的数据时,它为每个通道设置VBO中的下两个顶点并呈现新帧.

我使用glMapBuffer()来访问数据一次,更新所有通道,使用glUnmapBuffer,然后根据需要进行渲染.

我提前手动计算变换矩阵(使用以非通用方式计算的正交变换来减少乘法),顶点着色器如下所示:

#version 120

varying vec4 _outColor;

uniform vec4 _lBound=vec4(-1.0);
uniform vec4 _uBound=vec4(1.0);
uniform mat4 _xform=mat4(1.0);

attribute vec2 _inPos;
attribute vec4 _inColor;

void main()
{
    gl_Position=clamp(_xform*vec4(_inPos, 0.0, 1.0), _lBound, _uBound);
    _outColor=_inColor;
}
Run Code Online (Sandbox Code Playgroud)

_lBound,_uBound_xform制服是每信道更新一次.所以,每帧32次.夹具用于将某些通道限制在屏幕上的y坐标范围内.

片段着色器很简单:

#version 120

varying vec4 _outColor;

void main()
{
    gl_FragColor=_outColor;
}
Run Code Online (Sandbox Code Playgroud)

还有其他东西被渲染到屏幕上; 通道标签,例如,使用四边形和纹理图集; 但是gDEBugger中的分析似乎表明行渲染占用了每帧的绝大部分时间.

尽管如此,对于我而言,50,000行看起来并不是一个非常大的数字.

因此,经过所有这些,问题是:加速画线是否有任何技巧?我尝试将它们渲染到模板缓冲区,然后剪切一个四边形,但速度较慢.我想过将线条绘制到纹理上,绘制带纹理的四边形.但是,由于不断上传大型纹理,这似乎不可扩展甚至更快.我看到了一种将y值存储在单行纹理中的技术,但这看起来更像是内存优化而不是速度优化.

sla*_*007 1

感谢大家。我最终决定在渲染缓冲区支持的帧缓冲区之间进行位块传送。效果很好。许多人建议使用纹理,如果我最终需要在数据后面绘制,我将来可能会走这条路。