Jam*_*mes 5 hive google-cloud-sql google-cloud-dataproc hive-metastore
默认情况下,Cloud Dataproc运行 Dataproc 集群本地的 Hive Metastore。这意味着:
元存储与集群一起是短暂的
使用单个元存储拥有多个集群可能会很痛苦
是否可以将 Dataproc 集群指向单个 Hive 元存储?是否也可以让元存储位于集群外部,这样就不需要为元存储运行集群?
是的,这是可能的 - 集群可以使用在Cloud SQL上运行的通用元存储。
Cloud Dataproc 集群可以使用此Cloud SQL 代理连接到外部 SQL 元存储。在使用此解决方案之前,您应该查看重要说明。