我的集群中有 3 个 Nvidia GPU,并且集群中运行着很多 pod。如何找到这些 Pod 中的哪一个调度 GPU 以及它们调度了多少个 GPU?
我使用此链接在集群中启用 Nvidia GPU 的 GPU 调度。 https://kubernetes.io/docs/tasks/manage-gpus/scheduling-gpus/
谢谢
这是 kubectl 插件kubectl-view-allocations给出的示例给出的示例:
\n> kubectl-view-allocations -r gpu\n\n Resource Requested Limit Allocatable Free\n nvidia.com/gpu (71%) 10.0 (71%) 10.0 14.0 4.0\n \xe2\x94\x9c\xe2\x94\x80 node-gpu1 (0%) __ (0%) __ 2.0 2.0\n \xe2\x94\x9c\xe2\x94\x80 node-gpu2 (0%) __ (0%) __ 2.0 2.0\n \xe2\x94\x9c\xe2\x94\x80 node-gpu3 (100%) 2.0 (100%) 2.0 2.0 __\n \xe2\x94\x82 \xe2\x94\x94\xe2\x94\x80 fah-gpu-cpu-d29sc 2.0 2.0 __ __\n \xe2\x94\x9c\xe2\x94\x80 node-gpu4 (100%) 2.0 (100%) 2.0 2.0 __\n \xe2\x94\x82 \xe2\x94\x94\xe2\x94\x80 fah-gpu-cpu-hkg59 2.0 2.0 __ __\n \xe2\x94\x9c\xe2\x94\x80 node-gpu5 (100%) 2.0 (100%) 2.0 2.0 __\n \xe2\x94\x82 \xe2\x94\x94\xe2\x94\x80 fah-gpu-cpu-nw9fc 2.0 2.0 __ __\n \xe2\x94\x9c\xe2\x94\x80 node-gpu6 (100%) 2.0 (100%) 2.0 2.0 __\n \xe2\x94\x82 \xe2\x94\x94\xe2\x94\x80 fah-gpu-cpu-gtwsf 2.0 2.0 __ __\n \xe2\x94\x94\xe2\x94\x80 node-gpu7 (100%) 2.0 (100%) 2.0 2.0 __\n \xe2\x94\x94\xe2\x94\x80 fah-gpu-cpu-x7zfb 2.0 2.0 __ __\nRun Code Online (Sandbox Code Playgroud)\n似乎提供了您正在寻找的东西。
\n此外,显然,共享 GPU 是可能的(使用 Nvidia 提供的软件)——可能对您或将来发现这一点的人有用:
\n| 归档时间: |
|
| 查看次数: |
2050 次 |
| 最近记录: |