我正在尝试使用张量流配置文件来测量详细的 GPU 内存使用情况,例如 conv1 激活、权重等。我尝试使用 TF 配置文件。据报告峰值使用量为 4000MB。但同时,我使用nvidia-smi进行测量,报告了10000MB的使用量。它们有很大的差异,我不知道根本原因是什么。有人可以提出一些继续进行的建议吗?
TF简介:
英伟达-SMI:
张量流版本:1.9.0
nvidia tensorflow
nvidia ×1
tensorflow ×1