我nvidia-smi用来查看计算节点上每个GPU的状态,但发现其中一个是E. Thread.是否有任何简单的方法可以将其切换回default mode?
------------------------------------------------------+
| NVIDIA-SMI 346.46 Driver Version: 346.46 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 680 Off | 0000:03:00.0 N/A | N/A |
| 30% 30C P8 N/A / N/A | 10MiB / 4095MiB | N/A E. Thread |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 680 Off | 0000:04:00.0 N/A | N/A |
| 30% 29C P8 N/A / N/A | 10MiB / 4095MiB | N/A Default |
+-------------------------------+----------------------+----------------------+
nvidia-smi -h
Run Code Online (Sandbox Code Playgroud)
将为您提供命令行帮助,还有一个手册页:
man nvidia-smi
Run Code Online (Sandbox Code Playgroud)
以下命令应将该设备重置为计算模式0(默认)
nvidia-smi -i 0 -c 0
Run Code Online (Sandbox Code Playgroud)
应该重置该设备(0)以计算模式0(默认)
您需要具有root权限才能以这种方式修改设备,因此要么是root用户,要么运行命令 sudo
为了知道当前Compute Mode,使用以下命令
nvidia-smi --query | grep 'Compute Mode'
Run Code Online (Sandbox Code Playgroud)
为了设置的Compute Mode,请使用以下命令
sudo nvidia-smi -c $i
Run Code Online (Sandbox Code Playgroud)
其中$ i可以是0、1、2或3。这些数字的含义如下-
0 Default
1 Exclusive_Thread
2 Prohibited
3 Exclusive_Process
Run Code Online (Sandbox Code Playgroud)
回答你的问题
sudo nvidia-smi -c 0
Run Code Online (Sandbox Code Playgroud)
这会将所有GPU设置为默认模式。-i 0如果仅要将其应用于GPU 0,请使用flag。