我可以将 Cloud Dataproc 与外部 Hive Metastore 结合使用吗?

Jam*_*mes 5 hive google-cloud-sql google-cloud-dataproc hive-metastore

默认情况下,Cloud Dataproc运行 Dataproc 集群本地的 Hive Metastore。这意味着:

  1. 元存储与集群一起是短暂的

  2. 使用单个元存储拥有多个集群可能会很痛苦

是否可以将 Dataproc 集群指向单个 Hive 元存储?是否也可以让元存储位于集群外部,这样就不需要为元存储运行集群?

Jam*_*mes 2

是的,这是可能的 - 集群可以使用在Cloud SQL上运行的通用元存储。

Cloud Dataproc 集群可以使用此Cloud SQL 代理连接到外部 SQL 元存储。在使用此解决方案之前,您应该查看重要说明