Google Kubernetes Engine 与 Vertex AI(统一 AI 平台)用于服务模型预测

And*_*rew 6 google-kubernetes-engine machine-learning-model google-ai-platform

随着 Google 最近发布了集成了所有 MLOps 平台的Vertex AI,我想知道在 GKE 上提供定制训练的 PyTorch/Tensorflow 模型与 Vertex AI(或 AI Platform Unified,因为刚刚进行了品牌重塑,并且 AI Platform 已经)有什么区别提供服务模型预测的能力)。

我做了很多研究,但几乎没有找到这方面的信息。我已经在 GKE 上托管我的 ML 模型,是否值得迁移到 Vertex AI?

注意:我还不打算在云上进行训练和其他数据预处理。

Sak*_*yan 5

Vertex AI 值得考虑为:

\n

Vertex AI 是一个 \xe2\x80\x9c托管\xe2\x80\x9d ML 平台,供从业者加速实验和部署 AI 模型。在部署/训练/预测 ML 模型时,我们不需要管理基础设施/服务器/运行状况。Vertex AI 将为您处理这一问题,并根据流量进行扩展。

\n

有助于考虑 Vertex AI 的一些关键功能:

\n
    \n
  1. Vertex AI 简化模型开发
  2. \n
\n

一旦模型经过训练,我们就可以获得详细的模型评估指标和特征属性。(特征归因告诉模型中的哪些特征信号模型 \xe2\x80\x99s 预测最多,这可以深入了解模型在幕后的执行情况)

\n
    \n
  1. 具有端点的可扩展部署
  2. \n
\n

模型经过训练后,就可以将其部署到端点。可以拆分模型之间的流量进行测试,也可以定制机器类型

\n
    \n
  1. 使用 Vertex 管道编排工作流
  2. \n
\n

顶点管道有助于避免模型漂移的概念,这种情况在模型周围的环境发生变化时可能会发生。Vertex 管道可以帮助自动化此保留工作流程。

\n
    \n
  1. 使用 Vertex AI 监控已部署的模型
  2. \n
\n

顶点模型监控可用于检测漂移和训练服务偏差等问题,因此,使用顶点 AI 无需手动检查以确保模型仍然正确执行,而是可以提供对模型可靠性的信心,因为我们会随时收到警报变化。

\n