SageMaker和TensorFlow 2.0

Ant*_*ton 7 tensorflow amazon-sagemaker tensorflow2.0

使用AWS Sagemeker运行TensorFlow 2.0的最佳方法是什么?

截至今天(2019年8月7日),AWS不提供TensorFlow 2.0 SageMaker容器,因此我的理解是我需要构建自己的容器

什么是最好的基本映像使用?示例Dockerfile?

hta*_*irt 8

2019 年 11 月 10 日更新:

现在有一种在 SageMaker 中使用 Tensorflow 2 的方法,尽管没有直接从 SageMaker 控制台启动 TF 2 的快捷方式。

  1. 启动 conda Python3 内核

  2. 进行一些更新(每个代码单元格中一个):

!pip install --upgrade pip         # pip 19.0 or higher is required for TF 2
!pip install --upgrade setuptools  # Otherwise you'll get annoying warnings about bad installs
Run Code Online (Sandbox Code Playgroud)
  1. 安装 Tensorflow 2
!pip install --user --upgrade tensorflow
Run Code Online (Sandbox Code Playgroud)

鉴于文档,这将安装在$HOME.

注意:

如果您使用的是基于 GPU 的 SageMaker 实例,请替换tensorflowtensorflow-gpu.

您现在可以在您的实例中使用 TF 2。只要实例保持运行,这只需执行一次。

要测试,只需在下一个单元格中运行:

import tensorflow as tf
print(tf.__version__)
Run Code Online (Sandbox Code Playgroud)

你应该看到2.0.0或更高。


小智 6

这是一个使用基础SageMaker Containers库的Dockerfile示例(这是官方预构建的Docker映像中使用的库):

FROM tensorflow/tensorflow:2.0.0b1

RUN pip install sagemaker-containers

# Copies the training code inside the container
COPY train.py /opt/ml/code/train.py

# Defines train.py as script entrypoint
ENV SAGEMAKER_PROGRAM train.py
Run Code Online (Sandbox Code Playgroud)

有关此方法的更多信息,请参见https://docs.aws.amazon.com/sagemaker/latest/dg/build-container-to-train-script-get-started.html