如何使用 TensorFlow 估算器和 Python Sagemaker SDK 指定最大运行时间?

Fra*_*olo 1 python tensorflow amazon-sagemaker

使用 Python Sagemaker SDK,可以使用 TensorFlow 启动一项训练作业,代码如下:

import sagemaker
from sagemaker.tensorflow import TensorFlow

sess = sagemaker.Session()
tf_estimator = TensorFlow(...)
tf_estimator.fit(...)
Run Code Online (Sandbox Code Playgroud)

是否可以在此脚本中的某处指定训练的最大运行时间?

Fra*_*olo 6

感谢 AWS 支持找到了答案:

TensorFlow 估计器有一个基类,sagemaker.estimator.Framework而基类又有一个基类sagemaker.estimator.EstimatorBase,该基类接受参数train_max_run,该参数接受以秒为单位的值,默认为86,40024hs

因此,估计器的初始化TensorFlow以传递最大训练运行时间的自定义值如下所示:

MAX_TRAINING_TIME = 99999
tf_estimator = TensorFlow(..., train_max_run=MAX_TRAINING_TIME)
Run Code Online (Sandbox Code Playgroud)