如何解释 intel-gpu-top 和 intel-gpu-overlay 的输出?

mpr*_*mpr 12 monitoring gpu intel

我编译并运行了这些命令,但它们的内容对我来说有点神秘。

从过程intel-gpu-overlay:读类似15R, 16B, 41ms waits。什么是R,什么是B,等待时间表示什么?

它有 CPU:152%(我猜这和我从上面得到的一样)。渲染:32%,比特流:6%,blt:6%。什么样的代码会导致这些值成为瓶颈,当它们发生时系统的行为是什么?

以下是 intel-gpu-top 的示例:

               render busy:  23%: ?????                                  render space: 12/16384

                      task  percent busy
                       GAM:  29%: ??????                  vert fetch: 1380772913 (5386667/sec)
                        CS:  23%: ?????                   prim fetch: 350972637 (1368891/sec)
                      GAFS:   9%: ??                   VS invocations: 1375586768 (5385212/sec)
                       TSG:   8%: ??                   GS invocations: 0 (0/sec)
                       VFE:   7%: ??                        GS prims: 0 (0/sec)
                       SVG:   3%: ?                    CL invocations: 677098924 (2648400/sec)
                        VS:   3%: ?                         CL prims: 682224019 (2663834/sec)
                      URBM:   2%: ?                    PS invocations: 9708568482932 (34396218804/sec)
                        VF:   2%: ?                    PS depth pass: 15549624948405 (58732230331/sec)
                       SDE:   0%:                      
                        CL:   0%:                      
                        SF:   0%:                      
                       TDG:   0%:                      
                        RS:   0%:                      
                      GAFM:   0%:                      
                       SOL:   0%:
Run Code Online (Sandbox Code Playgroud)

Geo*_*sen 6

取自 OP 评论中给出的链接。

我也很好奇,所以这里只是我可以从参考手册中获取的一些内容。同样令人感兴趣的是intel-gpu-tools 源,特别是lib/instdone.c它描述了可以出现在所有英特尔 GPU 模型中的内容。这个补丁在翻译所有这些首字母缩略词方面也非常有帮助!

有些可能是错的,如果有知识渊博的人可以插话,我会很高兴的!当我学习这些东西时,我会回来更新答案。

首先,右边的三行:

  • 渲染空间可能是使用常规的3D操作。
  • 从谷歌搜索,比特流似乎是关于音频解码?这是一个非常通用的术语,很难通过查询找到。虽然它没有出现在我的 GPU 上(Skylake HD 530),所以它可能不是无处不在。
  • 阻击器在卷中描述。11 并且似乎负责 2D 操作(位块传输)的硬件加速。

固定功能 (FF) 管道单元(老式 GPU 功能):

  • VF:Vertex Fetcher(第一卷),3D 流水线中的第一个 FF 单元,负责从内存中获取顶点数据。
  • VS:顶点着色器(第 1 卷),在 GPU 绘制的每个图元的顶点上计算事物。GPU 上非常标准的操作。
  • HS:船体着色器
  • TE:曲面细分引擎
  • DS:域着色器
  • GS:几何着色器
  • SOL:流输出逻辑
  • CL:剪辑单元
  • SF:Strips and Fans (vol.1),FF单元,主要功能是将strips和fans等原始拓扑分解为primitives或objects。

用于线程和管道管理的单元,用于 FF 单元和 GPGPU(有关这一切如何工作的大量信息,请参阅英特尔开源高清图形程序员手册):

  • CS:Command Streamer (vol.1),图形处理引擎的功能单元,用于获取命令、解析命令并将它们路由到适当的管道。
  • TDG:线程调度器
  • VFE:视频前端
  • TSG:线程生成器
  • URBM:统一返回缓冲区管理器

其他的东西 :

  • GAM:请参阅GFX Page Walker(第 5 卷),也称为Memory Arbiter,与 GPU 如何跟踪其内存页面有关,看起来与TLB(另请参阅SLAT)为您的 RAM 所做的非常相似。
  • SDE:南方显示引擎;根据卷。12,“南方显示引擎支持热插拔检测、GPIO、GMBUS、面板电源排序和背光调制”。

学分:

StackOverflow 用户 F.X.