如何配置Google Cloud Datalab以将GPU用于TensorFlow?

sku*_*erk 5 google-cloud-platform google-cloud-datalab

我可以在Cloud Datalab中导入tensorflow和运行模型,但是如何配置它以使用GPU?

这里的文档只讨论机器,我不知道如何通过Datalab进行配置:https: //cloud.google.com/ml-engine/docs/how-tos/using-gpus

我试过这个:

datalab create --machine-type standard_gpu ml
Run Code Online (Sandbox Code Playgroud)

当我选择us-east1区域时,我收到错误:

Creating the instance ml
ERROR: (gcloud.compute.instances.create) Some requests did not succeed:
- Invalid value for field 'resource.machineType': 'https://www.googleapis.com/compute/v1/projects/project-160204/zones/us-east1-d/machineTypes/standard_gpu'. Machine type with name 'standard_gpu' does not exist in zone 'us-east1-d'.
Run Code Online (Sandbox Code Playgroud)

Chr*_*ers 3

您链接到的页面(https://cloud.google.com/ml-engine/docs/how-tos/using-gpus)确实描述了在使用 Google Cloud ML Engine API 进行训练时如何使用 GPU,您可以提交使用 Datalab 针对 ML Engine API 的作业。Datalab 中包含其中的一些示例(例如,samples/ML Toolbox/Image Classification/Flower/Service End to End.ipynb)

如果您想在 Datalab VM 上本地训练 Tensorflow 模型,则 Datalab 必须针对 Datalab VM 上的 GPU 运行,目前尚不支持。

  • 有两个问题:运行 Datalab 的 VM 没有安装 NVidia 驱动程序(除非您自己安装),并且由于需要 NVidia 许可证,Docker 映像本身没有安装 CUDA 或 GPU 支持。此外,还必须安装 Tensorflow 的 GPU 版本。 (2认同)