无法将作业重新提交到ml-engine,因为"具有此ID的作业已存在"

slc*_*ott 7 tensorflow google-cloud-ml-engine

我正在尝试向gcloud ml-engine提交一份工作.作为参考,该作业正在使用Google提供的此示例

它经历了第一次,但是与此问题无关的错误,现在我正在尝试在纠正错误后重新发出命令:

gcloud ml-engine jobs submit training $JOB_NAME \
                                    --stream-logs \
                                    --runtime-version 1.0 \
                                    --job-dir $GCS_JOB_DIR \
                                    --module-name trainer.task \
                                    --package-path trainer/ \
                                    --region us-east1 \
                                    -- \
                                    --train-files $TRAIN_GCS_FILE \
                                    --eval-files $EVAL_GCS_FILE \
                                    --train-steps $TRAIN_STEPS
Run Code Online (Sandbox Code Playgroud)

,其中$JOB_NAME= census.不幸的是,似乎我不能重新提交作业,除非我改变继续$JOB_NAME成为像census2,然后census3,等每一个新的工作.

以下是我收到的错误:

ERROR: (gcloud.ml-engine.jobs.submit.training) Project [my-project-name]
is the subject of a conflict: Field: job.job_id Error: A job with this
id already exists.
Run Code Online (Sandbox Code Playgroud)

这部分设计是否无法使用相同的工作名称重新提交,或者我遗漏了什么?

Chu*_*ley 2

不确定这是否有帮助,但在Google 的 Flower 示例代码中,通过将日期和时间附加到作业 ID 来避免错误,如第 22 行所示,例如,

declare -r JOB_ID="flowers_${USER}_$(date +%Y%m%d_%H%M%S)"
Run Code Online (Sandbox Code Playgroud)