小编Edm*_*ght的帖子

有没有办法在不轮询 REST API 的情况下收到 Google AI Platform 训练作业中状态变化的通知?

现在,我通过轮询作业 REST API 来监控我在 Google AI Platform(以前称为 ml 引擎)上提交的作业。我不喜欢这个解决方案有几个原因:

  1. 如果状态更改之间的间隔小于监视轮询率,则状态更改的感知通常会延迟或完全错过
  2. 大量不必要的网络流量
  3. 大量不必要的函数调用

我希望在我的培训工作完成后立即收到通知。如果有某种方法可以在作业状态更改时分配挂钩或回调以运行,那就太好了。

我还考虑过在 AI Platform 上运行的训练任务 python 包中直接添加对云函数的调用。但是,我认为这些函数调用不会发生在训练作业意外关闭的情况下,例如当作业被 GCP 取消或强制结束时。

有没有更好的方法来解决这个问题?

google-cloud-platform google-cloud-ml gcp-ai-platform-training

2
推荐指数
1
解决办法
468
查看次数