如何使用Google Compute Engine实例设置Tensorflow群集来训练模型?

cha*_*ler 5 kubernetes tensorflow-serving gcp

我理解可以使用docker图像,但是我需要Kubernetes来创建一个集群吗?有关于模型服务的说明,但是关于Kubernetes的模型培训呢?

Sym*_*ric 2

您可以使用 Kubernetes作业来运行批量计算任务。但目前(大约 v1.6)在 Kubernetes 中设置数据管道并不容易。

您可能想看看Pachyderm,它是一个构建在 Kubernetes 之上的数据处理框架。它添加了一些不错的数据打包/版本控制工具。