我的问题是是否可以以某种方式查询 MPS 服务器并检查它是否在应用程序运行时在 GPU 上运行?
据我所知,通过使用 nvidia-smi 可以检查 CUDA MPS Server 是否在 GPU 上运行,但我不确定如何在应用程序运行时使用此系统命令。是否有其他方法可以检查 MPS 服务器在应用程序运行时是否在 GPU 上运行?
我找到了一种方法,但如果您认为可能有更好的方法,请分享。无论如何,这种方法对我来说很有效。
基本上,当 MPS 控制守护进程启动时,会在 /tmp/nvidia-mps/ 中创建一个名为control的文件,当守护进程退出时,该文件将不再存在。
我使用访问功能来检查 /tmp/nvidia-mps/control 文件是否存在。
这是代码:
#include <unistd.h>
#include <stdio.h>
int main()
{
int result;
const char *filename = "/tmp/nvidia-mps/control"; // only available if nvidia-cuda-mps-control daemon is running
result = access (filename, F_OK); // F_OK tests existence also (R_OK,W_OK,X_OK).
// for readable, writeable, executable
if (result == 0)
{
printf("%s MPS demon is running!!\n",filename);
}
else
{
printf("%s MPS demon doesn't exist!\n",filename);
}
return 0;
}
Run Code Online (Sandbox Code Playgroud)
这是结果:
# gcc mps-checker.c -o mps-status
# nvidia-cuda-mps-control -d
# ./mps-status
/tmp/nvidia-mps/control MPS demon is running!!
# echo quit | nvidia-cuda-mps-control
# ./mps-status
/tmp/nvidia-mps/control MPS demon doesn't exist!
Run Code Online (Sandbox Code Playgroud)