假设纹理,顶点和着色器数据已经在显卡上,您不需要向卡发送大量数据.有几个字节来识别数据,可能是一个4x4矩阵,以及一些其他各种参数.
那么所有的开销来自哪里?操作是否需要与gpu进行某种握手?
为什么发送包含一堆小模型的单个网格,在CPU上计算,通常比发送顶点id和转换矩阵更快?(第二个选项看起来应该发送更少的数据,除非模型小于4x4矩阵)
3d graphics optimization performance gpu
3d ×1
gpu ×1
graphics ×1
optimization ×1
performance ×1